大数据,又称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据具有四个“V”特点,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value):第一,数据体量巨大。从TB级别,跃升到PB级别。数据的单位,已经从G和T发展到P、E、Z、Y等为计量单位。计算机中存储信息的基本单位是字节(Byte)。一个西文字符用一个字节存储,一个汉字需要两个字节存储。其他单位及其相互间的关系分别为:1K=1024Byte,1M=1024K,1G=1024M,1T=1024G,1P=1024T,1E=1024P,1Z=1024E,1Y=1024Z。有资料称,2011年全球的数据量达到1.8Z。第二,数据类型繁多。不仅包括人们在互联网上发布的信息,而且全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。第三,价值密度低,商业价值高。也就是说单位数据的价值并不高,需要耗大量精力在大量的数据中发现有价值的数据或者将低价值的微小数据集聚成有价值的大数据。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多行业的潜力。

大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用,工程和科学问题尚未被重视。大数据工程指大数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。如中国物联网校企联盟认为,物联网的发展离不开大数据,依靠大数据可以提供足够有利的资源。

对于趋势的预测,也是大数据技术的价值所在。科学家的研究,已经越来越清晰地揭示出,人类行为多数是可以预测的,正如《爆发——大数据时代预见未来的新思维》书中所指出的:各种各样的记录人类行为的数据库,虽然给人类带来了前所未有的风险,但“同时也创造了一个历史性机遇——它第一次毫无偏见地为我们提供了成千上万人,而不是少数人的详细行为记录。在过去几年里,这些数据库为各大实验室提供了不少帮助,使很多计算机学家、物理学家、数学家、社会学家、心理学家以及经济学家得以在强大的计算机和新技术的支持下,对某些问题进行仔细研究。实验的结果令人振奋。他们有充分的证据证明,人类的大部分行为都受制于规律、模型以及原理法则,而且它们的可重现性和可预测性与自然科学不相上下”。

目前,“大数据”的概念及其价值更多的是被IT业和企业营销领域所关注,但事实上,传媒业也将是受到大数据时代冲击的主要行业之一。

20世纪50年代,美国就有媒体记者利用大型计算机对政府提供的数据库中的信息进行分析,以发现和调查新闻事实。之后,在西方,计算机辅助报道(ComputerAidedReporting,简称CAR)逐渐兴起。在这样一个新的领域内,人们不断探讨着以数据为基础挖掘新闻、解释新闻的方法。那些或公开或隐蔽的数据,成为记者发现新闻选题、拓展新闻深度的重要资源。

大数据技术正在对今天的新闻业形成冲击,它在一定程度上将对现有的新闻生产的模式与机制产生影响,这主要体现在:大数据技术渗透到新闻生产的核心环节,重树新闻质量标杆,进一步提升受众反馈的价值,拓展用户分析广度与深度。在大数据技术等因素的推动下,新闻业务将实现一些方向性调整,如趋势预测性新闻和数据驱动型深度报道分量的增加,数据呈现、分析与解读能力的提高,新闻生产中跨界合作的增强。   


大数据是什么,大数据的主要特点是什么?_大数据特点