https://mp.weixin.qq.com/s/nR8TeluLHlea8MGa6qBljg
By 超神经
场景描述:从古至今,有考试的地方就有作弊,作弊方法可谓是五花八门,妖魔鬼怪各显神通。尽管有法律约束与层层安检搜查把关,却依然难防漏网之鱼。近年来,利用计算机视觉、神经网络等技术,可以更加精准地抓取作弊行为,让考场更加公平。
关键词:计算机视觉 人工智能监考 反作弊
不知不觉,又到了一年的高考季。明天全国高考就将拉开大幕,千万名考生将迎来一次大的考验。
尽管高考总是存在槽点,但对大多数人来说,它还是一场相对公平的比赛。不过想要维护考试的完全公平,并不是那么容易。
今年又是高考的大年 ,报名人数在 2009 年之后,首次超过 1000 万。面对巨大的考生群体,各个环节的合理部署至关重要,而这其中,做好防作弊工作将是重要的一环。
因为选拔考试的重要性,总有一些人不惜冒着犯法的风险,动出歪念头来。因此,作弊这个顽疾,自古至今都让考官操碎了心,却依然难以根除。
作弊与反作弊的斗智斗勇
自从隋朝有了科举,作弊现象很快就出现了,五花八门的作弊手段也纷纷亮相。到了明清时期,作弊方法更是数目繁多,达到了顶峰。
纵览科举中的作弊手段,大体上可归为三大类:夹带、请托和替考。
博物馆中展览的纸夹带和丝质夹带
夹带就是我们今天所说的打小抄;而请托和替考,则是贿赂考官泄露考题,在阅卷放水,或者花重金请枪手代考。
夹带是最常用的一种作弊方式。常见的手法除了衣物夹带,还有极其袖珍的小书。
古代科举考试中的小抄,文字大小接近米粒
乾隆年间,还诞生了一种更高明的手段——米雕:考生在米粒上雕刻文字带进考场。
为了打击作弊,古代朝廷也见招拆招,费尽了心思。
从唐代起就有了严格的科场纪律。比如糊名考试与誊录的制度,杜绝了请托关照。而据《金史》记载,为了防止夹带,会在考前对考生「解发袒衣,索及耳鼻」,仔细搜身一番。
清代科举考试用来作弊的夹带鞋
而乾隆帝为了严惩夹带之弊,曾下旨让步军统领,五城御史进行彻底搜查。但严整之后不久,又出了新的作弊之风。
长达 1300 年的科举制度,最终在 1905 年被废止,但是考场作弊行为却一直持续至今,手段也越来越「巧妙」。
2017 年上映的泰国电影《天才枪手》,里面就有谍战一般的大型作弊场面。它是根据 2014 年轰动一时的 SAT 亚洲考场作弊案改编,令人咋舌。
如今,高科技也被利用来作弊,比如隐蔽式耳机,带有微型摄像头的眼镜,利用无线通讯设备接收答案……
微型耳机,有的考生考试结束后不幸地取不出耳机 只好去医院就医
为了严防作弊,法律上也有了更加严格的管束,而且防作弊的举措也越来越多。尤其是近两年,人工智能技术也加入了防作弊阵营,开始在考场上「维护正义」。
人工智能当监考官
以 DST (dynamic simulation technique)动态模拟技术起家的ATA(全美在线),利用人工智能和大数据技术,帮助维护考场的纪律。
他们通过历史上数以万计的考场视频,对考生的动作进行分析,从而检测出异常行为。
智能监考机器人对考场内人和物的识别与标注
另外,借助深度学习算法的计算机视觉感知技术,他们的方案,覆盖了考场视频监控的全感知前端、计算大脑、展示分析后端,建立起了智能考场的 AI 感知分析体系。
系统通过深度学习算法等技术,能实现实时跟踪,分析出考场异常行为。通过对考生动作的骨骼行为分析,对违纪行为进行提示和报警。
而一旦发现大动作、使用手机、离开座位等行为,系统就会发出警告。相应的视频也会被上传至云端,作为电子证据。
系统对动作异常的考生进行提示和警报(红框所示)
此外,ATA 还利用考场智能建模,场景语义识别技术,对考场座位进行语义分割,自动绘制考场二维平面图。
二维平面图与实际场景一一对应,实时显示考生入座、离座的情况,以及全考场行为热力图,方便老师掌握考场整体动态,监考不再有死角,减轻了监考老师的负担。
这套智能监考系统,已经被用于 2018 年的注册会计师考试中。
神经网络与大数据查抄袭
除了对作弊行为的监测和控制,还有一个方法是从答卷中检测抄袭。
丹麦哥本哈根大学的研究人员在进行一项此类研究,通过人工智能的书面分析来检测作业上的作弊行为,这个项目名为 Ghostwriter(枪手)。
他们通过对 10,000 名高中学生的 130,000 份丹麦语书面作业,进行文本分析,训练出了检测模型,能够以近 90% 的准确率,判断出作业是本人书写还是抄袭得来的。
项目研究者 Stephan Lorenzen 博士说到,Ghostwriter 是围绕机器学习和神经网络构建的。它使用了「Siamese」神经网络,能够分析语法错误,句子长度及其结构,常用短语等模式。
团队使用不同的输入通道,考虑几种不同的体系结构 (例如,char,word,POS-tags) 最终确定了一种最佳的网络架构
团队对神经网络进行大量数据训练,主要从写作风格的表示中学习,进行判定比较。
当学生提交作业时,网络会将其与之前的作业进行比较。对比之后,会给出新作业与旧作业书写样式的相似性百分比。
给出的分数,通过加权平均,作为一项计算因素。此外还综合考虑如提交时间等因素,最终会给出一个得分,以百分比表示出风格的相似性,判断是否涉嫌作弊。
Ghostwriter 还可用于警察分析伪造文件、法医文件审查等其他工作中。
跟作弊说再见
考试中的作弊行为令人不耻,但总有投机分子想要通过捷径得到利益。为了让考试更加的公平,通过 AI 防作弊工具的使用,能够减轻监考方面的人力成本,并有效检测出作弊行为。
当然,在防作弊的路上,也并不是为了炫技,借助技术防作弊更主要的目的,是希望从根本上杜绝作弊行为,让考生放弃作弊的念头。
如果把研究作弊手段的心思用在学习上,大概也就不需要作弊了吧。
祝愿每一位考生都有一个公平的考场环境,能够充分发挥出自己的水平,取得理想成绩。
超神经数据集
UMD Faces 面部数据集
UMD Faces 数据集是一个面部数据集,主要用于身份鉴定研究。
它有 8501 个主题的 367,920 个面孔,分为两部分:367,888 个静止图像和对 8,277 个主题视频的注释。视频帧来自 3100 个主题视频的超过 370 万个带注释的视频。
该数据集于 2016 年由发布,主要发布人为 Ankan Bansal,Anirudh Nanduri,Carlos D Castillo,Rajeev Ranjan 和 Rama Chellappa。
相关论文为 UMDFaces: An Annotated Face Dataset for Training Deep Networks;The Do’s and Don’ts for CNN-based Face Verification。
HyperAI 超神经搜集并整理全球数百个公开数据集,还提供国内镜像下载,对科研机构和开发者们提供免费服务。
更多有关影视图像识别的数据集,请访问 https://hyper.ai/datasets 或点击阅读原文获取。