大数据会是一场概念的骗局么?近期这样的讨论在网上随着大数据的话题而不断涌现出来。其实大数据并不是一项全新的技术,它的本质表现在数据的形态更为复杂,增长的速度更快和交互的频率更高 今年已经被认为是计算时代的“大数据”元年,各大平台即服务(PaaS)提供商备受媒体的关注,比如亚马逊、谷歌、Heroku、IBM和微软。但是哪些提供商在公共领域真正提供最全面的A
原创 2012-06-14 14:18:34
679阅读
1, 大数据可以用于人才管理(录,离,升,降,调)。 招聘时候根据简历内容自动给出测试题,机器自动过滤,判单候选人是否适合公司的岗位,适合什么岗位,根据大数据分析,可以提前3个月预测人员是否会离职,提前采取留人措施。 问题:收集什么样的员工数据,以及如何收集这些数据,来预测人员是否会离职? 2. C ...
转载 2021-10-28 22:24:00
344阅读
2评论
     范承工:大家下午好,欢迎来到EMC和VMware主办的计算和大数据论坛。 我是范承工,过去三年我在VMware公司负责云中数据管理的战略与研发,与此同时我也负责了一些VMware和EMC合作的项目,非常高兴看到两家公司能够在这个题目上在中国一起举办这样的论坛。 刚才宋总和蔡总对于在计算时代大数据趋势以及客户的案例做了很好的介绍。我讲一些更加技术
推荐 原创 2012-08-14 09:41:19
6040阅读
3点赞
2评论
HAWQ, 这是一款原生Hadoop并行SQL引擎。它完整兼容ANSI-SQL标准语法, 支持标准JDBC/ODBC连接,支持ACID事务特性,可以秒级动态加减节点,拥有各种容错机制,支持多级资源和负载管理。
原创 2023-02-14 10:02:55
239阅读
在当今企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。大数据将挑战企业的存储架构、数据中心的基础设施等,也会引发数据仓库、数据挖掘、商业智能、计算等应用的连锁反应。未来企业会将更多的TB级(1TB=1024GB)数据集用于商务智能和商务分析。到2020年,全球数据使用量预计将暴增44倍,达到35.2ZB(1ZB=10亿TB)。大数据正在彻底改变IT世界。10月几大科技巨头的举动使更多人意识到所谓的高科技泡沫——即“大数据”正在无限的膨胀。微软与Hortonworks合作开发Hadoop早在今年2月,微软的HPC开发团队就公布了被称为“Dryad”的分布式计算平台。这也标志
转载 2011-11-09 08:30:00
104阅读
2评论
在当今企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。大数据将挑战企业的存储架构、数据中心的基础设施等,也会引发数据仓库、数据挖掘、商业智能、计算等应用的连锁反应。未来企业会将更多的TB级(1TB=1024GB)数据集用于商务智能和商务分析。到2020年,全球数据使用量预计将暴增44倍,达到35.2ZB(1ZB=10亿TB)。大数据正在彻底改变IT世界。10月几大科技巨头
转载 精选 2011-11-09 21:06:36
327阅读
 很多人觉得计算应该是个具体的事物,所以初听到计算时,总会先问一句:“什么是计算”? 什么是计算?问的人轻松,回答的人却很费力,仿佛描绘一种味觉,感觉强烈,却不知如何抓住要领呈给面前的人看个仔细。倘若尽心给出一种解释,或画出一张架构图,听众可能还是一脸茫然,回答的人多半会急得皱眉跳脚,也有人会撂下一句:“你记得是IaaS、PaaS和SaaS即
原创 2012-12-21 09:21:28
422阅读
1.计算哲学(组织资源以服务,组织技术以实现,组织流程以应变):服务和平台(1)定义:既是指在互联网以服务形式提供应用,也是指在数据中心提供这些服务的软件数据中心的硬件和软件(2)前身:超大规模分布式计算(3)核心思想:通用、动态:、多租赁弹性:控制损耗(群组通信:单点失效、冗余机制、多活体机制、消息顺序机制)、状态感知(成员管理服务、全局视图)、动态平衡(由节点增加而对负载进行的动态均衡、
很多人觉得计算应该是个具体的事物,所以初听到计算时,总会先问一句:“什么是计算”?什么是计算?问的人轻松,回答的人却很费 大会上,谷歌的CEO施密特(Eric Schmidt)在
转载 2012-12-27 09:35:00
155阅读
2评论
在当今企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。大数据将挑战企业的存储架构、数据中心的基础设施等,也会引发数据仓库、数据挖掘、商业智能、计算等应用的连锁反应。未来企业会将更多的TB级(1TB=1024GB)数据集用于商务智能和商务分析。到2020年,全球数据使用量预计将暴增44倍,达到35.2ZB(1ZB=10亿TB)。大数据正在彻底改变IT世界。10月几大科技巨头
翻译 2022-12-05 12:06:15
72阅读
 现在想想也不记得当时是怎么找到《大数据时代》这本书的,好像是在查找数据库方面的书,看到亚马逊推荐的书里有这本,发现最近才出版的就买一本回来看看。   然而这个过程中,其实自己已经得到了大数据带来的影响。 我的浏览记录被亚马逊监视着,根据这些记录它们寻找和我浏览记录相关(同类)的书籍,预测我会看它们的可能性比较大,于是在亚马逊给我的推荐书目里,就多了一本大数据时代。而我买
原创 2013-04-11 16:51:41
635阅读
一、大数据的结构1.大数据的结构化大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业
2017年最热的技术词汇非人工智能A莫属,大数据B和计算C渐少人提及了,但就像倒在了杯子里的啤酒,当泡沫逐渐消去,醇香才开始四溢!让我们一起回顾一下计算平台在2017年都有哪些精彩!公有混战难分胜负2017年,中国公有市场群雄混战。互联网大鳄、外资巨头、硬件厂商、初创新贵们,似乎都觊觎着这块肥肉,不肯离场。阿里继续一骑绝尘,最新一季度营收近30亿人民币,继续同比100%的成长,虽然还不盈
转载 2018-08-13 09:18:29
467阅读
大数据时代: 生活、工作和思维的大变革一书写的相当不错,深入浅出,实例丰富。不过读的时候,常让人迷恋于各种小故事,而无法一下子把握整本书的想阐述的思想脉络。所以,自己列个提纲,记录一下书内的一些闪光点。 第一部分:思维变革一共三章,这三章其实是一个整体,联系起来理解其实会更深刻。抽样、精确、因果三者之间的关系是什么?在解决经典统计问题,三者的作用是什么?而针对大数据状况下,全部、混杂、相关的作用是什么?1. 抽样vs全部抽样在数据收集时效性不能保证时采取的办法。而采用全部数据模式,是因为信息收集技术的进步。 而全部数据模式会比抽象数据更能反映 问题的本质。因为抽样数据需要保证随机性,而不是数量
转载 2013-09-27 19:08:00
189阅读
2评论
wifi探针数据分析本项目实现的主要功能:通过探针设备采集可监测范围内的手机MAC地址、与探针距离、时间、地理位置等信息:探针采集的数据可以定时发送到服务端保存:利用大数据技术对数据进行人流量等指标的分析。最终以合理的方式展示数据处理结果。1、数据收集数据收集由服务器和探针设备共同完成,探针采集数据并发送到服务器,服务器接收探针设备的数据,处理成定格式保存至分布式文件系统(HDFS)中,供数据处理
转载 2023-07-29 23:40:21
35阅读
大数据”一词近年来在IT行业很火热,相信大家都有过这样的体验,在购物软件上购买或者浏览了一件商品,下次再购物时会收到同类商品的推送,这是因为我们的浏览记录和购物记录都会存到软件后台数据里面,商家会根据这些数据预测我们感兴趣的商品,这就是大数据的应用之一。大数据又叫做巨量资料,指无法在一定时间范围内使用常规的工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有的更强决策力、洞察发现力和流程
原创 2021-04-01 17:45:31
1075阅读
大数据”一词近年来在IT行业很火热,相信大家都有过这样的体验,在购物软件上购买或者浏览了一件商品,下次再购物时会收到同类商品的推送,这是因为我们的浏览记录和购物记录都会存到软件后台数据里面,商家会根据这些数据预测我们感兴趣的商品,这就是大数据的应用之一。 大数据又叫做巨量资料,指无法在一定时间范围内使用常规的工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有的更强决策力、洞察发现力和流
转载 2021-04-03 21:17:34
1015阅读
2评论
 从目前来看,如果我们想要完整的认知计算,应该从“服务”和“平台”两面去理解,即计算涵盖计算平台和计算服务这两个概念。 如前所述,计算服务代表一种新的商业模式,对于任何一种商业模式而言,除了理论上可行之外,还要保证实践上可用。对于计算服务来说,要面向海量用户提供永远在线、随时访问的可用服务,而且支持多用户按需获取服务资源,并保
原创 2012-12-25 10:30:49
317阅读
 从目前来看,如果我们想要完整的认知计算,应该从“服务”和“平台”两面去理解,即计算涵盖计算平台和计算服务这两个概念。 如前所述,计算服务代表一种新的商业模式,对于任何一种商业模式而言,除了理论上可行之外,还要保证实践上可用。对于计算服务来说,要面向海量用户提供永远在线、随时访问的可用服务,而且支持多用户按需获取服务资源,并保
原创 2012-12-25 10:31:15
264阅读
 我们每个人都同时存在于多个组织结构之中,要承担着不同的角色分工。为了达成一个统一的目标,所谓“组织”必须考虑如何合理、有效地进行规划、分工、协调、制衡等,以期顺利达成目标。 计算创新性地将大量计算资源组织在一起,协同工作,意味着计算必须在信息技术的层面,给出一种针对大规模系统的科学管理办法。我们已知面对大规模系统时,单纯人工管理的无力,于是计算采取了一种
原创 2012-12-25 10:32:47
486阅读
  • 1
  • 2
  • 3
  • 4
  • 5