作为工业社会理性文化成果,几乎每个项目都将遵循一定的流程和最佳的执行步骤。大数据绩效管理项目更不能例外。通常一个大数据项目必须存在6个步骤。

作为工业社会理性文化成果,几乎每个项目都将遵循一定的流程和最佳的执行步骤。大数据绩效管理项目更不能例外。通常一个大数据项目必须存在以下步骤:

1.定员立项——从人开始。应尽最大努力锁定大数据应用领域有经验的开发人员和管理人员。通过他们与用户进行有效、深度沟通,凝练需求,明确应用程序研发目标。

2.设定数源——确定基本数据范围。充分利用现有数据,必要时迅速启动数据挖掘、整理、开发等辅助工作。

3.规范数据——对应用数据架构做规范处理,这是承上启下的重要环节,约占整个项目工作量的60%—90%,且投入巨大,需要数据工程师和数据科学家的积极参与。

4.数学建模——数据构建工作完成,形成持续数据流,即可基于数据和政务管理(绩效考核)策略构建数学模型。这是项目管理工作的核心,因为已有诸多可用于参考的数学应用模型,工作量不会太大。

5.模型评估——从技术和管理两个层面,对上一步所选模型进行评估,包括精确度和精密度,并进行必要的修正、调试。

6.投入使用——经过选择、调试得到满意的模型,就可结合实际政务数据,进行应用。

上述步骤中,第一步最为关键,因为项目团队人员的能力和团队精神将是决定项目最终结果的关键。

团队人员的选择一般包括以下三种方式:一是对有绩效管理经验的人员进行大数据知识培训,二是对从事大数据工作的人员进行绩效管理知识的培训,三是完全委托第三方专业团队完成。前两种方式需要时间,而第三方外包,同样需要对供方能力进行评估,从而建立长期的信任关系。

第二步设定数源需要在具有经验和知识的工程师的指导下完成。对于当下的大数据绩效管理项目而言,获取数据往往是最大的问题。原因并非是没有数据,而是获得的众多数据项是否可以用于大数据相关分析。

文献讨论大数据采集时常常提到以下概念:量(Volume,)、类(Variety)、频度(Velocity)、价值(Value)和真实度(Veracity)等。

首先是量。为了准确地进行预测,大数据算法需要大量的数据来训练和验证模型。相对而言,数学模型更容易处理传感器的连续数据,而不是事件或人类记录的主观数据。但绩效管理的特点,就是大量数据来源于人的主观记录。为减少人为记录的主观性,保证数据质量,可采取如下措施:增加收集数据的频率,使用数据选项记录方式替代直接输入,采用专用工具采集数据。需要指出的是,数据多未必最优。比如,某一路口的4K监控摄像机可以在短时内收集到大量图像数据,但如果只需获得该路口每分钟的车流量,对采集数据的要求则简单而数据量小。因此,应尽早确定对各种类型的项目需要收集什么样的数据,而且尽可能在更大的范围内统一。

其次是类别。绩效管理将涉及诸多类型的项目,单一尺度评价模型算法显然无法适应。因此,不仅需要收集大量数据,还需区分不同类别数据的不同特征。为使不同管理级别、不同省份等等之间的数据具备可比性、具有兼容性,就需要建立组织、提出标准、进行规范,以确保数据交换、比较的可行性,同时也有利于缩短积累数据的时间。

再其次是数据采集频度。如果采集数据的频率很快,须同步考虑存储速率和存储成本的问题。

最后是价值和真实度(Veracity 也可以翻译成可信度或可用度)。如果某组数据经过数据挖掘会提供出极有用途的精准见解和指向,我们就会认为这组数据很有价值。同时,如果这组数据可信度或可用度很高,那么挖掘出的见解和指向将具有指导性意义。相反,如果对数源不很信任,那挖掘出的见解和指向可能就没有什么价值。比如,用从腾讯抓取的每个微信群每天发多少条信息的数据,可以较准确地衡量每个微信群的活跃度,这条信息的可信度或可用度就很高,因为没有什么非客观的东西。如果是通过大家在群里的发言,从而得出95%的人都喜欢某个电影的结论,就可能有些牵强附会。

总而言之,每个大数据项目必须以大量的基础数据为依托。数据分为结构化和非结构化,非结构化数据必须被结构化后,方能被用于大数据和人工智能的算法。所以,在数据采集过程中,在保证数据量的同时,更应重视数据的可信度和可用性,从而增加数据的价值。因为只有部分被采集到的数据将帮助我们对政务绩效管理做出有价值的评价。

千里之行始于足下。大数据分析技术应用与预算绩效管理,不可能一蹴而就,必须从培养人才和有针对性地收集系统有效的数据开始,循序渐进,久久为功。(智巨)