主流大数据技术可以分为两类:一类是面向非实时批处理业务场景,着重于处理传统数据处理技术在有限时空环境里无法胜任TB级、PB级海量数据存储、加工、分析、应用等。比较主流支撑技术有:HDFS、MapReduce、Hive等。另一类是面向实时处理业务场景,比较主流支撑技术为HBase、Kafka、Storm等。(1)HDFS  HDFS是Hadoop核心子项目,是整个
转载 2023-07-29 19:36:13
91阅读
企业面临挑战之一是:传递大数据。传递大数据受限制于IT基础设施,需要解决大数据规模和动态性问题。与大数据有关不同架构思想大数据技术和它组件设计原则大数据功能需求: 1. 采集数据 2. 组织数据 3. 集成数据 4. 分析数据 5. 按照分析结果执行操作其他需求: 1. 架构支持,强大运算能力和速度也非常重要 2.支持海量数据存储 3.也需要有适当冗余,以防产生意外
大数据技术是在传统数据处理手段无法应对海量数据实时需求情况下,采用新信息技术来应对大数据爆发进行数据处理技术大数据技术一般可以包括基础架构支持、数据采集、数据存储、数据计算和数据展现交互等。  大数据技术分类大数据技术涵盖范围十分广阔。基础架构支持方面主要包括了支撑大数据处理基础架构级数据中心管理、云计算平台、云存储设备及技术、网络技术、资源监控等技术。而为了处理数据,则需要有大规
原文链接:http://click.aliyun.com/m/13856/ 11+大数据行业应用实践请见https://yq.aliyun.com/activity/156,同时这里还有流计算、机器学习、性能调优等技术实践。此外,通过Maxcompute及其配套产品,低廉大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps;更多精彩内容参见云栖社区大
转载 2017-03-16 19:03:27
1192阅读
数据平台需要具备哪些能力?以及数据平台技术选型及理由本文就针对以上两个问题为大家进行一次概述数据平台应该具备能力一、应该具有多维度抓取数据能力,能够通过ETL或者数据流组件方式 ETL,是英文 Extract-Transform-Load 缩写,用来把数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至数据仓库过程。源端一般包括各种数据库,日志文
现在,数据新名词层出不穷,顶层有数字城市、智慧地球、智慧城市、城市大脑…企业层面的有数字化转型、互联网经济,数字经济、数字平台平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱…技术层面的有数据仓库、数据集市、大数据平台数据湖、数据中台、业务中台、技术中台等等,总之是你方唱罢他登场,各种概念满天飞…今天结合“数据中台”,以作者从事数仓行业多年实战经验来看,
            
转载 2023-07-10 13:34:01
714阅读
元宇宙,被称为“互联网终极形态”“人类数字化生存最高形态”,是超越现实世界虚拟世界。2022年腾讯、苹果、谷歌、亚马逊、脸书都投入了大量资源来概念化“元宇宙”并创建必要基础设施,争取在技术上实现“元宇宙”。那元宇宙到底是什么呢?实现元宇宙应用究竟需要哪些技术支撑呢?元宇宙(Metaverse)是利用科技手段进行链接与创造,与现实世界映射与交互虚拟世界,具备新型社会体系数字生活空间。元宇
大数据是客户获取业务洞察力关键推动因素,在IT,营销,财务,安全性和合规性以及业务运营等关键业务领域发挥重要作用。 对于大数据平台,以熟知Hadoop分布式框架使用并行跨多个服务器和存储实现分布式数据处理,并且形成了工具和应用生态系统,帮助使用者了解和处理不断增长海量数据,将多种数据源包含结构化、非结构化数据进行统一数据展示和管理,但是现在基础设施是否能适用应用发展?大数据集群基于物理
原创 2021-04-23 13:20:22
481阅读
大数据中心平台一般是三个部分:大数据、超算、云计算,三个部分进行混搭以满足不同数据处理场景。本人目前接触大数据大数据正常分为三个模块: 1)大数据平台建设目前是Hadoop平台(java技能,接触最多是HWFI大数据业务平台); 2)大数据计算(数字敏感性,常用计算语言HQL、CQL、Scala) 3)大数据挖掘(算法技能,常用实现语言python) 目前因为岗位需要,目前在
转载 2023-07-18 15:05:32
197阅读
通过快速部署、很低资本成本和可扩展性,云计算给公司企业了巨大价值。然而,选择IaaS解决方案还是PaaS解决方案对云项目的回报速度以及应用程序开发创造价值时间会有重大影响。将大数据解决方案部署到云端时,一个早期讨论点和常见架构决定就是选择IaaS解决方案,还是选择PaaS解决方案。大多数大型云服务提供商同时提供高度专业化PaaS功能和比较灵活IaaS功能,让架构师可以选择合理兼顾功能
导言在前面的文章《「大数据技术体系」学习实践导览》(https://blog.51cto.com/yaocoder/5711005)中,概要式梳理了大数据平台业务目标,大数据平台架构框架,大数据平台中常用技术及工具,数据治理四方面的内容,算是对自身所了解大数据知识体系抛砖引玉。今天想以自身经历和实践经验,分享一下大数据平台技术生态、开发管理与应用架构。为求简明扼要,内容主要以图示概览
原创 精选 2022-12-15 09:24:47
1408阅读
# 大数据平台主流技术架构 随着互联网迅猛发展,数据量呈指数级增长。大数据技术应运而生,旨在解决数据存储、处理和分析各种挑战。在这些技术中,主流架构通常包括数据采集、存储、处理和可视化四个部分。本文将具体阐述大数据平台主要技术架构,并提供代码示例。 ## 1. 数据采集 数据采集是大数据平台第一步,通常使用工具如 **Apache Nifi** 或 **Kafka**。这些工具能够实
原创 2024-10-07 03:16:09
147阅读
# 阿里大数据平台技术架构解析 随着互联网技术发展,数据产生和积累逐渐呈现出爆炸性增长。以阿里巴巴为代表企业,纷纷建立了大数据平台来应对海量数据处理和分析需求。本文将简要介绍阿里大数据平台技术架构,并通过代码示例和图示来帮助读者更好地理解。 ## 阿里大数据平台概述 阿里大数据平台是一个综合性解决方案,主要由数据采集、存储、处理和分析等多个模块构成。其核心目标是实现数据高效存储
原创 9月前
209阅读
# Hadoop大数据平台技术组件实现流程 ## 1. 介绍 在开始教授如何实现Hadoop大数据平台技术组件之前,我们先来了解一下Hadoop大数据平台基本概念和组成部分。 Hadoop大数据平台是一个开源分布式计算框架,用于处理大规模数据存储和分析。它主要由以下几个组件组成: - Hadoop Distributed File System (HDFS):分布式文件系统,用于存储
原创 2023-08-31 09:53:08
50阅读
# 构建大数据平台技术实现架构 ## 引言 作为一名经验丰富开发者,我将向你介绍如何实现“大数据平台技术实现架构”。在这个过程中,我将指导你完成每一个步骤,为你提供必要代码示例和解释。 ## 流程图 ```mermaid gantt title 大数据平台技术实现架构流程图 section 定义需求 定义需求 :done, 2022-01-01, 3d
原创 2024-05-23 03:58:56
11阅读
## PaaS大数据平台技术架构复盘记录 在IT行业背景下,随着大数据技术快速发展,PaaS(平台即服务)大数据平台逐渐成为企业数据处理重要解决方案。自2015年以来,越来越多企业开始为处理和分析大量数据而上云,这一趋势推动了大数据平台PaaS架构不断演进。在这篇文章中,我将详尽记录解决PaaS大数据平台技术架构问题过程,包含背景描述、技术原理、架构解析、源码分析、性能优化和总结与展
原创 6月前
81阅读
GIS大数据平台技术架构描述 随着地理信息系统(GIS)和大数据技术发展,GIS大数据平台在城市规划、环境监测、交通管理等领域应用愈发广泛。然而,构建这样一个平台并非易事,它对技术架构设计提出了更高要求,包括大数据处理、实时数据流、空间数据存储与查询等方面。这些都要求我们在设计时充分考虑性能、可扩展性和灵活性。 在本文中,将详细探讨GIS大数据平台技术架构,包括背景描述、技术原理、
原创 6月前
108阅读
网易大数据平台Spark技术实践 网易大数据平台Spark技术实践 作者 王健宗 网易实时计算需求 对于大多数大数据而言,实时性是其所应具备重要属性,信息到达和获取应满足实时性要求,而信息价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客点击行为分析
转载 2016-11-06 03:14:00
137阅读
2评论
大数据系统大体可以分成以下四个部分: 1,数据采集层 2,数据计算层 3,数据服务层 4,数据应用层下图是阿里巴巴大数据系统架构图:一、数据采集层数据采集主要分成以下三块数据: 1,Web 端日志 2,App 端日志 3,第三方数据(比如 mysql 增量数据同步)Web 端和 App 端日志数据都需要制定各个场景下埋点规范,用来满足各种通用业务场景下(比如浏览、点击等)数据分析。Web 端
  • 1
  • 2
  • 3
  • 4
  • 5