Hadoop集群Spark运维实战
转载 精选 2013-06-25 19:29:54
490阅读
前言:大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或大量)
原创 2022-08-19 17:30:42
233阅读
1.BigSQL (整合了pg和hadoop的一个开源项目) [url]http://www.bigsql.org/se/[/url] 2.Cloudera Manager DB [url]http://www.cloudera.com/content/cloudera/en/home.html[/url] 3.Hadoopdb (耶鲁大学的一个开源项
原创 2023-06-04 16:27:46
202阅读
1,为什么产生大数据技术 答:首先,大数据是指利用常规的软件捕获,处理和管理大数据的时间超过可容忍时间的数据集。 其次,随着当前信息技术的发展,为大数据存储和流动提供了物质基础。 最后,大数据拥有着价值密度低,种类繁多的特点,大数据也逐渐成为"新石油"。 由此可见,大数据技术的产生是不可避免的,是时 ...
转载 2021-09-09 22:05:00
334阅读
2评论
数据类型结构化数据(structured data):RDBMS传统的关系型数据库中的表通常由一个或多个字段组成,每个字段都预先定义了其可存储数据的格式及约束等,这类的数据就是结构化数据(structured data)一个设计良好的数据库在其schema中定义这些格式或约束,并由相应的RDBMS为这些提供实现保证相应地。半结构化数据(semi-structured data):Page...
原创 2021-08-10 09:45:24
199阅读
大数据指的是无法在一定时间范围内用常规软件进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和据....
原创 2022-07-04 11:37:58
147阅读
GeaFlow(品牌名TuGraph-Analytics) 已正式开源,欢迎大家关注!!! 欢迎给我们 Star 哦! GitHub?https://github.com/TuGraph-family/tugraph-analytics 更多精彩内容,关注我们的博客 https://tugraph-analytics.github.io/背景自2003年Google的三篇大数据领域经典论文GFS、
原创 2023-07-05 17:07:18
101阅读
数据类型结构化数据(structured data):RDBMS传统的关系型数据库中的表通常由一个或多个字段组成,每个字段都预先定义了其可存储数据的格式及约束等,这类的数据就是结构化数据(structured data)一个设计良好的数据库在其schema中定义这些格式或约束,并由相应的RDBMS为这些提供实现保证相应地。半结构化数据(semi-structured data):Page...
原创 2022-04-06 15:22:19
144阅读
本文作为“存储基础知识”系列文章之一,将介绍大数据概念和组成部分。
原创 2013-11-22 17:38:30
421阅读
一、定义与特点对于大数据目前还没有一个权威的定义,每个领域、公司、个人等对大数据的定义是不同的,但是总结起来大致包含三层定义:数据量达到一定级别,能够满足一定的分析需求;传统的方法和技术很难进行有效的分析;通过对大数据的分析,可以得出在少量数据下无法得出的结论。通常我们所说的大数据,更多的指的通过对大量数据进行快速分析,在较短的时间内得出有价值的信息。
原创 2021-07-09 10:24:50
362阅读
(尊重劳动成果,转载请注明出处:http://blog.csdn.net/qq_25827845/article/details/53606112 冷血之心的博客) 1、Hadoop是什么? (1)Apache Hadoop软件库是一个框架,允许在集群服务器上使用简单的编程模型对大数据集进行分...
转载 2016-12-13 09:08:00
125阅读
2评论
大数据是指规模巨大、复杂度高、以及传统方法难以处理和分析的数据集合。这些数据集通常包含结构化、半结构化和非结构化的数
按照大数据应用层次划分,可以把大数据相关技术分为数据收集、数据存储、资源管理、计算框架、数据分析和数据展示这六类,各类代表性组件如下图:
原创 2021-09-28 19:52:16
3898阅读
7点赞
1评论
医疗保险的大数据时代[摘要]:随着现代科技的不断进步,信息技术呈现出跨越式大发展的格局,以移动互联网、物联网、大数据和云计算等为代表的新技术应用,大幅提高了社会的生产生活效率。其中以大规模并行计算、人工智能、机器学习等为特征的大数据应用,使得大范围快速分析和智能预测成为可能,将革命性地改变政府机构和企业管理的运行模式。那么医保经办机构在具体的经办管理过程中,面对“医保监管难”等一系列问题,是否能够
转载 2023-07-19 22:09:15
30阅读
大数据经过反复炒作之后,慢慢的降温下来。大家不再大谈几个v了,落地到企业会发现,大部分场景还是传统的
原创 2021-07-14 09:42:39
323阅读
大数据概念想必大家都不陌生,毕竟是近年来最热门的话题之一。在计算机以及互联网如此普及的今天,我们所有人每天都会在互联网上产生大量的数据,例如在淘宝浏览商品时会产生数据,使用社交app进行即时通讯时也会产生数据,每天股市的上涨下跌及交易量也是数据......如此可见,每天互联网上产生的数据是有多庞大,数据可谓是无处不在:但是数据量大,只是大数据概念的特征之一,大数据有4个特征简称4V特征:在2001
原创 2018-01-26 18:37:48
7910阅读
2点赞
大数据安全规范   一、概述大数据的安全体系分为五个层次:周边安全、数据安全、访问安全(认证 - authentication和授权 - authorization)、访问行为可见、错误处理和异常管理。下面依次说明:1.周边安全技术即传统意义上提到的网络安全技术,如防火墙等; 2.数据安全包括对数据的加解密,又可细分为存储加密和传输加密;还包括对数据的脱敏;&nbsp
转载 2023-07-13 20:21:18
63阅读
  现在说起大数据,那是相当火的“时髦词”,大家在炒概念大数据并不难,怎样利用大数据还是很难得,在我看来,目前很多人都在吹嘘大数据。但是真正懂大数据的人却寥寥无几
原创 2016-04-25 13:39:17
974阅读
1kafka的iSR,AR代表什么kafka需要所有的iSR全部同步完成,则表示同步成功AR:分区的所有副本1、AR在Kafka中维护了一个AR列表,包括所有的分区的副
原创 2021-04-25 22:58:42
404阅读
1点赞
          
原创 2024-08-22 14:27:46
58阅读
  • 1
  • 2
  • 3
  • 4
  • 5