你的努力终将兑现 |“交通事故成因分析竞赛”1天倒计时_竞赛

 

 

你的努力终将兑现 |“交通事故成因分析竞赛”1天倒计时_竞赛_02距交通竞赛决赛还剩1天

你的努力终将兑现 |“交通事故成因分析竞赛”1天倒计时_竞赛_03

 

 

 

致所有的决赛者

你的努力终将兑现 |“交通事故成因分析竞赛”1天倒计时_竞赛_04

@DC小运营

 

明天就是“交通事故成因分析竞赛”决赛现场答辩的日期了,也许所有参加决赛的团队都在做最后的调整,紧张?期待?兴奋?释然?惴惴不安?宠辱不惊……我试图用能想到的所有词去描述你们,但终究还是功亏一篑。因为你们的优秀,让我黯然失色,也让所有的人充满期待。

 

我能想到内心最盛大的波澜就是庄重严肃却充满期待的倒计时了,习惯在苦难中攀爬,在泥泞里打滚,穿越漫无边际的黑暗,忍受常人无法企及的孤独,在最后华丽绽放,美丽而优雅。我想这应该是最让人动容的时刻吧!

 

有时候,我们为了一份坚持,需要编造上万个理由给自己,而放弃,或许一个就足矣。你们的坚持与用心,把看似普通的事做到与众不同,你门的人生一定有很多值得炫耀的东西。

 

也许你们走过很多弯路,历经挫折和失败,但仍然在追逐梦想的路上奋力前行,也许别人口中的牛逼对于你们而言只是无愧于心而已,正如决赛的如期而至,你们的努力终将兑现。

 

 

 

昨天DC官网上线了关于交通竞赛决赛的竞猜活动,小伙伴们非常积极,期待更多的“神算子”出现,同时,投票活动也在紧张地进行,毕竟1000块钱,也够整个团队决赛后在大排档好好吃一顿了。

 

决赛团队的的创意方案都非常精彩和优秀,不同的方法,不同的角度对交通事故的成因进行分析,并且提出了对应的解决方案,让我们一起来看看。

 

 

忘了爱

 

我们基于数据回答了许多有趣的问题,包括:哪些车型有遭遇事故的危险?什么样的路段容易发生事故?什么样的天气容易发生事故?肇事老司机都是什么样的人?我附近有哪些事故高频区域?除此之外,我们还利用专业知识和相关科研资料,以严谨的方法并结合多源数据,一步步逼近引起交通事故的幕后黑手,撰写了较为全面的数据分析报告。此外,为了方便大家更好地理解事故的成因,也为了管理者更好地基于数据做出决策,我们还开发了两款数据驱动应用,希望大家能喜欢~

 

 

 

求真

 

探究了驾驶员特征、车辆特征、道路特征、环境特征对事故发生量、事故类型、事故间隔时间、事故发生风险的影响。方案由浅入深、由简单到复杂,结合地理信息分别运用了单因素分析、一般线性模型、空间误差模型、空间面板数据分析、持续风险模型、生存分析参数模型、Logit回归分析等方法进行了研究。方案考虑了一般模型中无法顾及的空间相关性,并将空间相关性与时间效应结合,使估计结果更为准确。方案充分利用了时间删失数据的信息,避免了因为时间数据的删失而流失的信息。最后方案提出了切实可行的改进措施与建议。

 

 

 

Diglab

 

这次竞赛中我们团队使用了Spark作为分析,处理数据的平台。Spark可以针对任意规模的数据进行高效并行处理。我们首先利用单个字段分析影响交通事故的主要原因,同时我们结合百度地图找出了疑似碰瓷者,利用GraphX对肇事者和受害者建立图模型检测出了一些疑似骗保者。在分析天气数据时候,我们发现能见度不好的情况下会对事故数量有很大影响,因此可以考虑增加能见度指标。最后利用贝叶斯模型来预测驾驶员发生事故的概率,对于发生事故概率非常高的驾驶员应该及时提醒他们,避免发生事故。

 

 

 

notheory

 

本团队从自然条件、驾校、群体、车型、地点各个方面对交通事故成因进行探索,利用统计分析方法对数据进行全面的认识,并使用图表可视化,直观展示事故规律;使用数据挖掘关联规则分析方法分析事故属性之间的内在联系,合理地对事故成因做出解释;使用地图API及实景地图针对事故地点规律特征进行探索,并可视化事故热度和时间之间的关系,对交通事故数据进行了全面深入的剖析。

 

 

 

Trafficer of BJUT

 

本方案针对贵阳交通事故数据及贵阳地理信息数据,探讨造成贵阳市交通事故时空分布不均匀的原因。在定性分析交通事故量在时间尺度和空间尺度变化规律的基础上,建立对数线性回归模型定量讨论五类城市空间要素与城市交通事故量时空分布的关系。此外,本方案运用研究成果,建立了较为精确的交通事故时间和位置分布的预测模型,并在此基础上研发了面向出行者的事故预警平台和面向管理者事故处理警力调度平台,以实现本研究成果服务居民出行与提高管理者效率的目的。

 

 

 

广西大学复杂性科学与大数据研究所

 

我们来自广西大学复杂性科学与大数据技术研究所,该研究所由国际知名学者高剑波博士创建,致力于在复杂性科学与大数据技术的方法和理论研究中继续拓展和深化;所内云集各专业学子,文理兼俱,注重创新。本次竞赛为我们提供了一个将理论研究转化为实际应用的平台,我们会不断提升队伍实力,争取更大的进步。

 

 

 

沐威智造

 

本作品主要利用描述性统计、数据融合、数据挖掘等方法,结合百度开源LBS服务的开发者API接口及GIS地理信息系统,挖掘事故的地理位置信息,将事故进行区域划分,分别总结了事故高发的各项诱因。提出从“需求侧服务-供给侧提升”两个方面缓解贵阳交通事故问题。需求侧服务:开发辅助安全驾驶APP,根据GPS、车辆和驾驶员属性、天气等信息为驾驶员提供警示提醒。供给侧提升:通过合理布置标志标线、隧道灯光,利用“错视觉”等方法提升基础设施服务水平,降低事故发生概率。

 

 

 

cdzj

 

本方案利用多种数据来源、融合统计学习、机器学习等多种技术方法,结合实际,细致、全面地分析了交通事故的影响因素,提炼出影响道路交通安全的诸要素及其影响的轻重程度,并从人、车、环境、管理方面提出一系列的改进措施。设计算法均易于工业上的实现和移植,实用性高。

 

 

 

步履不停

 

针对这次交通事故成因分析竞赛,我们首先对贵阳交通事故数据进行了数据预处理,包括数据清洗与转换、概念分层以及数据拓展等;然后运用了关联规则、决策树、条件概率分析等数据挖掘方法,同时结合OpenStreetMap、百度地图等地图工具进行综合分析,得到了一些有意义的结论和建议;最后使用了如ECharts、百度地图热力图API等进行可视化处理。希望我们在本次比赛中所做的工作、得出的结论与建议能够成为贵阳市交通管理部门日后进行交通事故数据分析的一个参照,为贵阳市改善城市交通环境尽一份绵薄之力。

 

 

 

sparkexeprt

 

本方案在分析原始数据的基础上,充分利用互联网公共平台提供的开放数据,采用图挖掘的方法,分析挖掘出故意发生交通事故的事故责任人;采用地图可视化分析的方法,分析挖掘事故发生的密集区域;采用多维统计可视化分析的方法,辅助分析交通事故各种因素之间的关联关系;采用关联规则挖掘的方法,从杂乱无序的数据中分析挖掘出诱发事故的主要因素,为政府部门整改地区路况与加强交通监管提供参考,为民众安全出行提供建议。

 

 

 

Misaki

 

水载航船行万里,关注民生才能发现问题所在。我们认为,民生舆论+数据佐证=事故原因,采用社会舆论和大数据相结合的方案,力图解决『交通拥堵——公交车速下降——公交分担率降低——刺激小汽车增加——交通更加拥堵——刺激电瓶车增加——交通事故频发——交通拥堵』的怪圈,帮助贵阳减少交通事故发生率,构建和谐社会。

 

 

 

三傻大闹宝莱坞

 

想知道如何选择合适的驾校吗?想知道哪里每天都在发生相同事故吗?想知道老司机与新手的区别吗?想明白女司机在想什么吗?三个数据分析的新手,历时6个月,使用3种分析方法,利用5种数据分析工具,引入6方面外部数据,从一开始的不能不会,到现在的娓娓道来,一切用数据说话。一切尽在贵阳交通事故成因分析竞赛,三傻大闹宝莱坞期待与你一起来说大数据。

 

 

 

Euler

 

如今,随着交通业的蓬勃发展,交通安全的隐患也随之逐年上升。如果我们可以预知,一个人在什么时间、什么地段容易发生什么样的事故,我们是不是就有办法进行预防了呢?!在此,我们使用了分类器的方法,对五万多条交通事故数据进行了清洗、处理、分析和建模,最终做到了对不同个体容易发生交通事故的时间和类型的个性化预测。这不仅将使我们可以告别导航仪千篇一律的危险路段提醒,更让我们可以在准确的时间对需要注意的事项进行定向的提醒。借助这一技术,未来的交通事故率将会大幅度的下降,最终给我们带来安全、惬意的出行体验!

 

 

 

云集实验室

 

云集实验室是电子科技大学资助的学生创新创业团队之一,致力于云计算、大数据理论创新和实践,共有研究生和本科生学生成员近20名。本项目成员李国忠、王金、黄超杰、杨吴同、叶宇飞同学在田文洪教授指导下长期从事云计算和大数据相关理论研究和实践项目。从2010年至今,先后获得VMWare公司、微软、IBM、安居客、深圳远望谷、长虹,东方通等公司组织的云计算和大数据相关竞赛的多个奖励。

 

 

 

Freeman凡人哥

 

方案收集了更加详细的天气数据、道路信息和车辆类型数据,对原始数据进行更新补充;采用组合赋权法对事故成因的重要度进行排序,筛选出七种主要因素。为了更好地发现交通事故成因的组合危险性,方案采用KMeans聚类算法对事故发生地点进行聚类,得到事故多发地段的中心点,并收集以此点为中心的一定范围内的交通事故数据作为多发地段事故数据。最后采用Apriori算法,将七种事故成因描述作为类,进行类关联规则的挖掘,并对挖掘结果进行分析,最终提出多致因因素下的道路安全改善措施。

 

 

 

 

萌哒哒的皮卡嗷呜噗啵

 

通过对相关数据(包括肇事数据、天气数据以及违法表数据)的清洗、解构、分析和解释,我们得到了一系列不同深度的关于人、车、路和环境对交通肇事的影响情况。从交通事故的表面现象中找寻隐藏的规律、深层的原因以及潜在的隐患是我们致力于达成的目标。而基于所得结论和目标状态,我们分别站在政府部门、大数据孵化中心和研究员的角度,提出了一系列解决方案,力图使数据真正产生经济价值和社会效益。

 

 

 

 

DMML$Three_bears

 

我们是来自贵州大学数据挖掘与机器学习实验室的DMML$Three_bears团队,此次我们在主办方提供的交通事故数据、违法记录数据和天气数据的基础上,同时参考贵阳市交管局发布的部分交通事故报告和道路施工信息以及高德交通拥堵系数用来补充路网信息。在对数据进行预处理和初步探索之后,从时间、地理位置等多个角度和维度尝试通过数据可视化的方式让数据“讲自己的故事”。在此基础上在通过主成分分析(PCA)的方法来寻找解释性高的潜在因素挖掘潜在交通事故成因并提出相关决策建议。

 

 

 

北京瑞安科技

 

本方案基于事故影响因素“时间-人员-车辆-道路-天气”构成的闭合星型数据模型,利用统计分析、聚类分析、关联分析、相似度计算、卡方检验等技术完成了贵阳交通事故成因定性分析。除竞赛数据外,补充了地图数据、政府数据、舆情数据、自有知识库等,通过不同数据相互补充、相互印证,从而得出更丰富、更准确的事故成因分析结论。

 

 

 

Algorhythm

 

依据贵阳市2015年全年的交通事故执法记录,结合包括天气等在内的外部因素和包括新浪微博等在内的非结构化数据,得到了贵阳市的道路网络、交通事故空间分布以及交通拥堵空间分布,进而由宏观和微观两个层面分别提出了基于出租车历史轨迹的群智导航和个性化路径选择两措施,其中,群智导航是建 立在出租车是城市路网最“忠实”的用户,处于自身“安全”和“快速”考虑,是城市交通中最智慧的出行群体,而个性化路径选择则是借助PU机器学习计算个体驾驶员的微观交通事故风险评分,进而指导驾驶员的路径选择行为。

 

 

 

数据侠

 

交通事故的成因复杂而多样,本方案在赛题方给出的数据上完成了一些分析工作,主要的亮点是将复杂的成因划分为“人”,“车”,“路”,“环境”四个维度分别进行分析,抓住了事故成因的主要部分,忽略次要因素的同时可以抓住大部分的细节,形成了分析算法和方案的有效脉络。我们还结合贵阳市的地理数据,细致地判断出每个详细地点、路段、区域的事故成因,这对于因地制宜地开展预防工作,区别化设计预防方案提供了良好的参考。此外,针对这些事故成因,我们提出了具体的预防措施。

 

 

 

飞龙在天

 

交通事故多样化,并且事故隐患种类繁杂。因此,本方案提出“平台+运营”模式的贵阳智慧交通解决方案。

1)搭平台:整合客运平台、公交平台、气象平台等各平台信息搭建“智慧云”,实现交通信息实时交换与共享,多维度信息协同辅助决策,提供综合交通信息服务。

2)精运营:以实时路况监控信息为基础,开展重点关注驾驶员、突发事件等实时预警,同时借助APP等载体,提供全方位服务运营。

 

 

 

以上就是本次决赛的全部创意方案了,是的,全都是优秀的作品,几乎没有人能够有必胜的把握,这也是决赛最精彩的地方,这注定是一场终极对抗,谁是最后赢家?我们共同期待。

 

 

● ● ●

 

如果未来需要一个解释

 

因为你倾注了5个月的努力

因为你有一群给力的队友,你们足够优秀

因为不菲的奖金和业内精英触手可及

因为你为每一个难题废寝忘食

因为你享受每一次的挑战和成长

因为你只是热爱

 

 

6月19日,贵阳见

 

● ● ●

 

 

你的努力终将兑现 |“交通事故成因分析竞赛”1天倒计时_竞赛_05