企业级大数据平台
原创 2019-09-03 11:14:59
1591阅读
# Hadoop 企业级大数据平台大数据时代,企业面临着海量数据的处理和分析挑战。Hadoop作为一个开放源代码的框架,为企业提供了高效存储和处理大规模数据的解决方案。本文将介绍Hadoop的基本原理、架构及其在企业级大数据平台中的应用。 ## Hadoop架构 Hadoop框架主要由两个核心组件组成: 1. **Hadoop分布式文件系统(HDFS)**: 用于存储大数据,可以在廉价
原创 5天前
16阅读
平台架构青云提供了完整的基础架构云和技术平台云,图中最下方的IaaS层提供标准的网络存储和计算服务,我们认为主机、虚拟机、容器、物理机等在架构中都是资源,共用同一套调度器。上层PaaS服务中的大数据平台以及数据库和缓存都是基于IaaS的,调用的是IaaS的API接口。再往上就是管理服务,它包含自身的一些部署架构。完整的企业级大数据平台一般的大数据平台架构首先面对的就是各种数据源,接着就是数据的传
原创 2021-03-18 09:36:27
200阅读
平台架构青云提供了完整的基础架构云和技术平台云,图中最下方的IaaS层提供标准的网络存储和计算服务,我们认为主机、虚拟机、容器、物理机等在架构中都是资源,共用同一套调度器。上层PaaS服务中的大数据平台以及数据库和缓存都是基于IaaS的,调用的是IaaS的API接口。再往上就是管理服务,它包含自身的一些部署架构。完整的企业级大数据平台一般的大数据平台架构首先面对的就是各种数据源,接着就是数据的传
原创 2021-05-06 15:01:47
497阅读
很早之前我写过一篇《企业级大数据平台建设参考 | 淘宝&滴滴&美团&360&快手&京东》。本文是李智慧老师《大数据技术架构:核心原理与应用实践》书中...
转载 2021-08-05 11:15:50
1921阅读
企业级大数据平台一:什么是大数据? 顾名思义,大数据就是一种规模庞大的数据集合。大数据有四个特点:海量的数据规模、快速的数据流转、多样的数据类型、价值密度低。二:大数据能做什么? 大数据的本质就是一堆非结构化和结构化的数据。我们需要利用算法去寻找海量数据中的规律,就像我们利用天文望远镜去探寻宇宙中的星球,宇宙就是一个大数据集合,天文望远镜就是我们的大数据应用技术和算法,而星球代表着人或事物的特征行
Hadoop  IO的操作意义:基于海量数据集的完整性和压缩性,Hadoop提供了用于分布式系统的API,包括序列化操作以及底层的数据结构。 1.HDFS数据完整性目的:保证用户在存储和处理数据时,数据不会有任何的丢失和损坏。(1)校验和检测数据的常见措施:在数据第一次引入系统时计算校验和(checksum),在数据通过不可靠的通道进行传输时再次计算校验和,这样就能发现数据是否
一、引言:在大数据建设过程中,通用的建设思路:从数据埋点——数据采集——数据清洗(ETL)——数据服务——数据可视化。整体流程可参考下图: 这篇文章主要想和大家聊聊的是,数据服务平台的建设。二、背景:由于数据加工完成的数据,需要给不同的应用和产品提供服务,包含:数据产品、实时大屏、线上应用、BI自主分析。由于业务场景不同,在根据不同的场景下选择的数据存储也多种多样,图中罗列:Hive、M
从业务的角度看,企业级大数据平台功能可细分为查询检索、数据挖掘、统计分析、深度分析,其中深度分析分为机器学习和神经网络。 从技术的角度看,企业级大数据平台功能细分为Batch、SQL、流式处理、machine learning、Deep learning。 企业数据一部分来自于本身的业务数据,比如
转载 2020-12-15 17:58:00
150阅读
2评论
在过去10年里,大部分公司都在做数字化转型,显然,数字化是以数据为支撑,辅助业务、战略、人力等进行全面提升的过程,那么在这时候就不仅仅是为了满足当下业务需求为主了,而要考虑未来企业数字化转型所面对的一系列问题,如何为了企业转型、人员效率提升等方面进行充分的考虑,这时候,组织上期望的一种效果是大部分的业务部门可以像使用Excel一样来使用大数据技术,大数据团队也希望更加的专注于技术优化和运维的角度,去构造一个稳定的地基。
企业级数据平台构建背景在没有大数据生态之前,企业内部大多数据量沉淀是有上限的,大多数的企业报表分析通过Excel、Mysql、SqlServer就可以满足相关的业务分析,随着互联网的蓬勃发展以及移动互联网浪潮的冲击下,数据量呈现了指数的增长趋势,在原有的技术实现路径中已经无法满足这种大数据量场景的分析需求,于是,随着大数据开源技术的发展,以Hadoop生态体系为根基的大数据技术栈得以充分填补了这
原创 2月前
97阅读
基本信息作者: Spark亚太研究院 王家林 丛书名: 决胜大数据时代Spark全系列书籍出版社:电子工业出版社ISBN:9787121247446上架时间:2015-1-6出版日期:2015 年1月开本:16页码:812版次:1-1所属分类: 计算机 > 数据库 > 数据库存储与管理 编辑推荐 ...
转载 2015-03-26 14:13:00
262阅读
2评论
数字经济的时代浪潮让企业纷纷踏上了数字化转型的征程,新业态与新产业的涌现,也在催生着新的需求,专业开发人员的缺口显著,数字化转型不断加快,传统的应用开发方式已经无法满足需求,近几年发展起来的“低代码技术”作为解决企业数字化转型以及增强企业复原力的有力手段,得到越来越多的关注,并不断渗透到各行各业。现如今,面对呈指数增长的低代码开发需求,开发者除了需要考虑工具的性能和培训成本,还需要考虑数据安全和
  2012年11月30日-12月1日,2012中国软件技术大会以“大数据时代的企业级应用”为主题,详细解析和展望当前的技术变革对传统的企业级网络、服务、智能、平台、融合的影响和驱动力。MessageSolution将携邮件归档审计解决方案参加此次大会,与千名来宾讨论邮件归档如何帮助用户解决法规遵从、电子发现、邮件审计等多项需求。 大会将邀请国内外知名的技术大
原创 2012-11-29 10:33:48
798阅读
数据在信息系统中的生命周期看,大数据数据源开始,经过分析、挖掘到最终获得价值一般需要经过6个主要环节,包括数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据可视化,每个环节都面临不同程度的技术挑战。
原创 2022-10-26 16:31:27
184阅读
1点赞
数据在信息系统中的生命周期看,大数据数据源开始,经过分析、挖掘到最终获得价值一般需要经过6个主要环节,包括数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据可视化,每个环节都面临不同程度的技术挑战。
原创 精选 2023-02-15 22:12:04
307阅读
1点赞
大数据数据源开始,经过分析、挖掘到最终获得价值一般需要经过6个主要环节,包括数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据可视化,每个环节都面临不同程度的技术挑战。
原创 精选 2023-03-15 21:08:54
242阅读
1点赞
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源前言本文是个人在从零搭建部门数据及运营平台的过程中的笔记。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非...
原创 2021-06-11 09:28:58
231阅读
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源前言本文是个人在从零搭建部门数据及运营平台的过程中的笔记。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非...
原创 2021-06-11 09:28:57
1107阅读
福利 | 企业级大数据平台构建:架构与实现 仅以此书献给所有大数据平台从业者
转载 2021-07-09 15:47:27
10000+阅读
  • 1
  • 2
  • 3
  • 4
  • 5