从业务的角度看,企业级大数据平台功能可细分为查询检索、数据挖掘、统计分析、深度分析,其中深度分析分为机器学习和神经网络。
从技术的角度看,企业级大数据平台功能细分为Batch、SQL、流式处理、machine learning、Deep learning。
企业的数据一部分来自于本身的业务数据,比如:MySQL、oracle等,还有一部分是大量的事件。数据源不同,处理的方式也不一样。传统的技术手段很难全面覆盖。采用大数据实时分析平台,那么,基于日志数据源,就用事件写入kafka;如果是针对MySQL、oracle等传统rdbms,就用Sqoop,写入HDFS里,并建立Hive的集群。还可以存一份数据在云端。有一部分业务就是对数据合并后放入HDFS做大量的业务查询和业务统计。这时希望用SQL的方式进行查询,会有很多选项,它选择的是大数据平台的Impala等。还有一些流式处理或机器学习可以用到大数据平台的Spark。
社会文献出版社就是一个很好的例子。出版社要想在市场竞争中取得一席之地,除了要有一支过硬的内容生产队伍,还需要人人能用数据说话。所以构建基于出版社的大数据运营体系,势在必行。社会科学文献出版社选用了Smartbi,并期望通过Smartbi建立企业的BI平台来解决如上问题。截至到去年,全社30%的员工成为Smartbi的重度依赖者,可以一天不刷微博,但不能一天不用Smartbi!
对于策划人员而言,之前在进行选题策划时,要听取发行人员的意见,或者随机发放调查问卷,这种方式会因为发行人员样本数量太小、主观性太强、问卷的可靠性低等原因导致调查结果与实际市场需求存在一定偏差。如今利用Smartbi对上游出版社和下游书店以及读者之间的数据进行分析,在需求最大的区域找出最合适的市场,以及不同个体的实时需求,挑选出社会公众关注度高的题材,与社交媒体上具有重大影响的公众人员进行联合宣传调查,从而实现精准的题材策划。
于运营人员而言,曾经天天加班做报表,即使是格式相同的周报、月报,还是需要每一次都进行手工填充。但有了Smartbi,只要用数据处理工具制作一次数据流,并基于该数据流制作一次分析看板,以后的工作量就是点击一次鼠标,选择自动更新源数据即可。同时,Smartbi是基于Excel设计的,兼容了绝大部分Excel的能力,他们不再需要懂代码,只要会Excel就能迅速上手。
除此之外,出版社还可以对收集的用户性别、年龄、所处位置、消费水平、职业、浏览记录、收藏书单、籍评价等个人信息进行分析,了解读者的行为习惯,以便迅速地在海量数据之中寻找到不同客户的需求,从而实现精准营销。同时,依据目标读者消费者的喜好,将营销信息很好地呈现在书籍设计和包装中,通过各种形式传达给读者,做每一位读者的专属在线书店。这种量身定制的数字化精准营销,对书籍的点击率、浏览时长以及购买率有明显的提升作用。
社会科学文献出版社对BI的应用逐渐从简单的工具应用深度融入到业务、管理、财税等各项活动中。
社会科学文献出版社做出的这个决定,太正确了。让数字化运营思路推动数据价值是涌出来的,只有管理层意识到数字化运营管理分析的重要性,让BI成为工作的一部分才能充分体现数据的价值。经营分析指标体系数据分析从各种维度分析具体指标,需要构建一套完整的指标体系、统一的规则,才能让各条线共享、认可数据分析的结果。