管理科学是数学、社会科学与经济学等学科相互交叉并在它们的边缘上发展起来的新学科,因此它既有理工类学科的属性,也有社会学科的属性。在管理科学中有一个管理学上的“帕金森定律”,是官僚主义或官僚主义现象的一种别称,随之管理机构的增多、膨胀、繁忙,组织效率出现越来越低下。这个定律,被称为二十世纪西方文化三大发现之一。也叫做“官场病”、“组织麻痹病”或者“大企业病”,源于英国著名历史学家诺斯古德·帕金森1958年出版的《帕金森定律》,这个定律中有一个“鸡毛蒜皮定律”,大致讲的是事情越大,开会研究的时间越短,反之时间则越长,像鸡毛蒜皮的事情反而花费时间很多。一件事情的时间和重要性相反。

行业大数据分析_数据

公安行业的大数据信息化建设应该怎么建设?在行业信息化建设大潮中,这个问题对于公共安全部门意义很大,也很复杂。那么,按照前面说的管理科学这个经典定律,是不是应该可以用最简洁的答案来回答这个问题?

用最简单的文字来描述公安行业的大数据,甚至是其他行业大数据应用的实现路径。在探讨这个复杂问题之前,先明确下自己对目前开展大数据应用的定位,首先在总体方向层面,公安行业的大数据应用主要应该立足现有成熟技术在行业的二次创新与集成应用;其次在数据资源层面,目前还是应该以海量的结构化数据为主开展应用探索;最后在目标任务层面,我们的主要目标任务是在工作过程中形成有公安行业特色的大数据思维、场景、模式与实现路径。那最关键的实现路径,即当下怎么干这件事。

第一阶段:从标签到人物画像

针对海量数据,通过标准化的数据标签处理体系,能够很好的迈出大数据应用的第一步:人物刻画。面向人、物、组织以及案事件等主体,以“打标签”的方式对相关数据进行分类、分层级的预处理,构建一个面向主体的用户画像过程。一个标准化的标签体系建设是实现人物刻画过程中最基础、也是最核心的工作,后续的大数据建模(包括传统的数据仓库搭建)、知识图谱的应用都会依赖于标签体系建设,在公共安全领域数据的准确性无疑至关重要的,标签体系也增强了整体数据分类精准度和应用置信度。

行业大数据分析_大数据_02

第二阶段:从建模到相关分析

建模型不是相关性分析的唯一办法,很早以前的年代,已经积累很多方法来进行类似关系或关联的分析。但是,到了大数据背景下,面向海量的数据资源,大数据的三要素,就是数据、算法、算力,通过“模型+算法”的形式来进行相关分析。关于模型与算法,关于相关性分析,这三个字几乎横跨了所有的象限,你不能把它简单理解成关系查找与确定。相关性分析是对总体中确实具有联系的标志进行分析,是研究不同主体之间是否存在某种依存关系,并对具体有依存关系的相关程度进行应用管理的过程,大数据背景下最经典应用应该是通过随机变量来进行关系的度量。

行业大数据分析_数据_03

第三阶段:从规律到趋势预测

趋势预测是大数据应用的终极目标,而进行趋势预测最需要依托的就是规律总结,因为规律是事物之间的内在的必然联系,决定着事物发展的必然趋向,按照传统的方法论,规律总结主要依托两种办法,一是抽象,二是演绎。大数据背景下进行规律总结也无法脱离这两种基本方式,但是,与传统依托人脑进行不同的是,立足海量数据以“机器学习”的方式进行规律总结是大数据应用的最典型特征。目前比较现实的具体应用办法是类比学习法,即利用两个不同领域中的知识库的类似性,从源域产生的特征和性质推导和产生出目标域的相应趋势。

行业大数据分析_数据_04

目前认知,从行业观点来看,以上总结是属于当前可以“落地”的东西,或者说目前就可以开始实施,有的可以立即落实到具体项目中,人工智能、机器学习也可以纳入到研究尝试阶段。

当然,这三个阶段也不是绝对的时序递进关系,并不是要把第一阶段全部做到位才能开始第二、第三阶段,在具体实施中的可能会有并列推进的情况出现,这完全取决于业务场景分析的深度以及数据资源的支撑力度,同时还有机制体制的配套问题也不容忽视。如对于两牢释放人员的后续管理,我们可以一边进行打标签刻画其不同维度的特征,也可以同步开展其与相关的人员、案件、物品以及线索的相关性分析,条件成熟的话,还可以进行重新犯罪概率的趋势预测。