近日,第三届图像识别竞赛WebVision中,阿里AI击败了全世界150多支参赛队伍,获得冠军。
WebVision由谷歌、美国卡耐基梅隆大学、苏黎世联邦理工大学等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前图像识别领域最权威的竞赛之一,被业界誉为人工智能“世界杯”。
该竞赛要求参赛的AI模型将1600万张图片精准分类到5000个类目中。竞赛结果显示,阿里AI以82.54%的识别准确率获得冠军,将万物识别领域的历史纪录提升了3个百分点。
(阿里AI在WebVision竞赛中夺冠)
此次竞赛,阿里AI引入了构建类别语义标签关系的模型,并采用了辅助信息模型进行图像去噪的深度学习技术。阿里AI的超强能力背后是阿里自研的可以支持数十亿图片分类训练的超大平台。
相比于经过人工标注完毕的ImageNet数据集,WebVision 所用数据集直接从互联网爬取,没有经过人工标注,含有较多噪音,且数据类别的数量组成极大不平衡,AI的识别难度更高。阿里AI在WebVision 竞赛结果表明,现代深度学习技术可以不完全以人工标注数据为基础,人工智能有望真正摆脱“人工”。
(阿里AI能够识别超过100万种实体)
目前,阿里AI不仅能够以超级速度对海量图片进行分类,还能识别超过100万种物理实体,例如5万种植物、1万种鸟、1千种不同型号的车……阿里AI正在帮助人类在线上世界里构建出一双全知全能的“上帝之眼”。
未来,阿里AI有望基于万物识别能力提升场景理解能力, 使得AI不仅具备视觉检测能力, 还具备“创造”能力,例如通过AI自动复原图像、自动生成图像等。