“大数据”,一词近来火的十分了得。仿佛远在天涯,却又近在咫尺。
近期×××发布了《关于实施<×××机构改革和职能转变方案>任务分工的通知》,通知内容包含了近一两年政府工作任务,其中包括推动建立统一的信用信息平台、建立以公民身份号码为基础的公民统一社会信用代码制度、出台并实施信息网络实名登记制度等。其中两关键词的信息或许说明了一些信息,网络实名与社会信用体系。
社会信用体系,早在2011年政府就已经部署制订社会信用体系建设规划,政府的关注点在于国家整体经济活动、市场经济、信用经济,在于完善市场机制的客观需要,在于协调经济发展,服务市场与机制;我们关注点在于怎样根据当前信用体系为我所用,把生活搞好,将工作做好;而更甚者,这些信息对于一个IT技术从业者或者与“大数据”有甚关系,下面的内容或许能简单说明。
社会信用体系目前阶段还是有相当的问题存在,就个人而言,每人都有一个个人信用报告,是由中国人民人行信用报告中心负责维护管理。个人信用报告内容目前主要包括个人基本信息、信用卡使用情况、社会保险、工作履历表。
1、 信用卡;目前这一项的影响因子无论对于房贷、车贷的评估还是其它贷款、信用评估活动都是比较大的一部分。信用卡使用情况的好坏影响深远。而对于不使用信用卡人员,其信用报告内容就缺少此部分信息,造成信用评估与风险预测的偏差,总体而言,信用卡等直接来自各金融机构的数据是相对精炼、价值较高,但是拥有信用卡者在整个社会中比例还不是很高,还没有发展到全民皆有的高度发达阶段,所以信用卡数据在整个信用体系数据中是稀疏分布的。
2、 社会保险;此部分对于信用评估的影响也是有很大比重,由于社会保险的缴纳与个人收入有关系,但也只能是一定程度上评估财力与偿还能力。其中比较现实的一点就是缴纳基数与缴纳比例根据不同的地区与薪资结构是各有不同,如北京地区的不同企业有按北京市平均工资作为基数缴纳,有按实际工资所得缴纳,同样,缴纳比例也与其它地方有所不同,数据本身也存在有噪声。
3、 其它;像个人信息、工作履历中也包括学历、工作年限、行业信息也都存在同样的问题,或有缺失,或有不实等等问题。
以上若干问题,在整个社会信用体系建设过程中是肯定需要大力提高的,对现有渠道的信用数据进行规范化、精细化提炼与处理是一方面,如上文提到的,由于数据来源的一部分局限性,终究还是会与整体社会信用体系的宏伟目标有很大的差距。还有另外一个方面就是扩大信用数据采集渠道。对于机器学习、数据挖掘、模式识别及相关内容的研究人员与从业者,可能很了解,对于一个复杂模型、一个算法,需要有一个数据集来训练、学习,然后不断调整、优化,但是在数据集相对较小规模时,有时无论模型或者算法已经达到极限,此时利用一些大规模数据集与简单的算法、模型反而得到很好的结果。
根据这个思路那么数据集的规模化可能是得到最优解的一个方向。具体到社会信用数据的规模化与“大数据”联系就密切了。
1、 电信业务;电信业务的使用报告,电信运营商同样含有大量电信级信用数据,同样是用户直接电子消费数据,电信业务的数据同样拥有非常高的性价比。
2、 交通出行;交通违章、地铁乘坐规律性、公交乘坐的占比。每个人的交通违章也是信用的重要参考依据,公交、地铁出行方式占整体出行交通工具的比例等等因素的深入挖掘同样是智能交通的领域这一,可以同步打通各系统,从顶层设计整体保障的信用体系的建设规范性。
3、 互联网使用;网络实名制的实行是一个很大的消息,对互联网数据的深度分析与挖掘时代可能来了。
4、 电子商务;电子商务企业的信用数据作为一个渠道也是十分必要的。信用人的购买力及电子商务体系的信用等级也是价值很高的数据,像阿里金融正是利用电子商务的活动形成的信用在展开的一系列金融衍生服务。
5、 社交活动;社交网络的数据也是非常精良的一个渠道之一,以点带面的进行人群的定向分析与评估,形成隐形相互评估与担保的信用数据生成机制。
6、 家庭生活;家庭关系的和睦与否也作为信用数据渠道之一也是非常必要,数据的采集可能要与民政部门与相关部门打通,各街道、委员会等要联动进行逐层汇总区域家庭生活报告统计。
7、 教育活动;不单纯以学历作为对教育结果的评估,要与教育系统各单位与机构打通,进行教育过程中的数据同步,针对过程与表现评估,避免以学历评估造成完全相同的结果。
8、 工作活动;与工作单位打通,将工作表现与绩效,汇总处理转化为信用体系中数据,以过程评估价值,避免以个人所得收入的结果作为单纯的评估标准,进行深度的职业潜力分析与财力预测分析。
9、 社会活动;如参加公益事业,组织公益活动。
10、经营活动;企业、经营者数据的采集,要与工商部门打通。
11、虚拟不动产;像个人电脑、智能手机等电子产品的虚拟登记与使用日志(像MAC登记、IP登记)。
这些渠道的加入,信用数据的规模将是无法想像的“大数据”,将是真正的Big Data ++。
如果利用上述逐步完善社会信用体系机制,相信不仅对全社会的经济活动、社会发展有益,对各行业的发展也是大有益处。像教育活动,或许对教育改革有联动效应,像家庭生活等社会问题也影响深远。
目前,上学逃课、睡觉;工作消极怠工、懒散;习惯于读书学习;乘公交支持绿色出行;孝敬父母、家庭和睦等等诸多方面内容很难与社会信用相联系,或许有一天真能成为现实,如果有那一天,这些各方面行为关系到一个人的切身利益,影响到在社会中学习、工作、生活,希望每个人都会有一颗年轻的心,向上的心,感恩的心。
什么是公平合理、什么是差异化,由于上述“大数据”的触角触及各层次、各方面,对于社会公平公正的政策执行也起着相当的参考作用。