非常感谢公司提供的机会,让我能够有这样的机会参观这场技术和产品的饕餮盛宴。半天多的时间,能够非常近距离接触友商,客户,以及处于产业链不同环节的公司和它们的产品,让我获益良多。这里对我个人的观展记录进行总结和分享。
我观展的主题围绕AI在产品中的应用落地进行,下面分别从AI的应用场景,芯片算法,软件技术栈几个维度来总结分享。
1.场景挖掘
应用场景方面,AI应用场景定义越来越细腻,AI是一项相对碎片化的技术,很难作为主体功能定义产品,这决定了它必须落地到具体的场景中,才能实现它的价值。过去几年,行业逐渐对一些常见的场景进行了智能化改造,有些产品形态已经比较成熟,竞争也会越来越激烈。未来,行业参与者将会挖掘越来越多的新场景来定义产品,这方面整个产业界包括AI算法厂商和系统方案商和终端设备厂商都有参与其中。这次展会,我看到了很多厂商提出了自己定义的应用场景,比如,智慧工地,智慧校园,智慧园区,智慧云厦,智慧空间,智能楼宇,智慧商场,智慧停车,智能教育,智慧通行,智慧社区,智慧办公,智慧出行,智慧身份验核,智慧锁,防火减灾。。。等等不一而足,这些做法是在扩大AI的应用场景边界,做大产业蛋糕,至少先做大自己擅长的那块儿,率先进军自己熟悉的场景领域建立技术壁垒或者技术标准。
尤其AI和IOT结合后,成为AIOT,场景定义更加泛化,几乎无所不在,无所不包,AI定义变成了”不缺少AI场景,只是缺少善于发现的眼睛”. 比较有代表性的比如熵基科技的智慧云厦方案,它的方案架构如下图所示。其实整个架构去掉AI的成分,也是一个合理的治理方案。针对小区大厦的管理,挖掘AI的使用场景,通过无所不在的传感器,IPC摄像头,安防监控,IOT互联网络等将AI功能赋能给最终用户。
类似的方案还有云天厉飞智慧校园,云从科技的智慧园区,智慧工地等等,
很多其它的场景挖掘也是类似的思路,比如涂鸦智能的智能婴儿看护器,让家长对宝宝的独处时候的安全更加放心,旷视科技的智能结构化人流行为统计分析能够统计集会,拥挤,繁华街区等场景下人们的行为,能够辨识出聚众,扭打,偷窃,摔倒,打电话,闯红绿灯,奔跑,抽烟,醉酒等行为,这些场景信息为公共安全管理部门提供了精确的信息输入,提高了这些部门的工作效率,也是归因于对各类场景的挖掘。
在这些方案场景中,AI并非是挑大梁的技术,更多的作为锦上添花的功能赋能产品,但是当用户使用习惯一旦养成,就会成为产品的刚需。这些方案的算力要求总体上分布在0.5T-2T之间,其中大部分的场景,比如停车厂,小区物业管理,校园,门禁系统等等一般的1T以下算力都可以满足场景需求。这方面,我们公司的V853/V851/V831/V833等均满足这方面的指标,有些友商比如亿智的SV系列,汉王科技在它们的智慧门禁产品上有使用,算力上和我们的V831相当。
旷视科技的3D自校准技术,可以辨别二维重叠的目标物体是否在三维角度真的重叠,可以根据车形,人形信息,利用算法将二维平面图转换为3D视图,有效辨别人流密集,车流碰撞等信息。
于场景安全方面,云天厉飞,旷视科技,熵基科技等多家厂商都提出了自己的解决方案,包括指掌纹识别,静脉识别,红外识别,3D点云识别,3D结构光技术,主动式活体检测,混合生物识别,虹膜检测,双模态人脸识别,辨别授权用户和非法用户,保证使用场景的安全。
举一个我身边的场景挖掘的例子,我住的小区建筑高19层,过去一段时间,时不时会发生一些高空抛物的事件,被跑的物体小到烟头,痰,生活垃圾碎片,大到香水瓶都有发生过。事关家人的人身安全,整栋楼的业主都很气愤,一起找到小区物业保安要求抓住那个罪魁祸首,可是无论大家当时多么团结,最后这事情都不了了之了。 当天在展会上,当我看到了相关的”高空抛物算法“ ,不由得产生联想,这是多么契合用户需求,直击用户痛点的场景啊,如果我当时就知道有这回事,现场给大家推荐这么一款神器,应该会收获一波赞的,如果是AW生产的,那就更吊炸天了。
对于未来发展方向,某位大佬曾说,“基于深度学习的算法精度会无限逼近100%,随着‘准确率’提升,最后竞争的更多是场景落地能力“.
芯片&算法
不止是AI算法厂商,包括各类的方案商和终端厂商都声称拥有自己的核心算法,可能是不同于芯片,算法比较好攒,技术门槛相对比较小,比如涂鸦科技参展商的各类音视频应用,汉王视频门禁终端等等,多声称使用的自研算法。
基于NPU硬件之上的人形,人脸,越界检测,移动侦测,车形,电子围栏,在离岗侦测,以及行为分析检测成为应用等场景是主流,这方面,之前只做算法的,纯粹的算法厂商,比如商汤科技(当天没参展), 旷视科技,云天厉飞等,也开始逐渐转型,讲芯片的故事,比如云天厉飞的边缘端人工智能芯片DeepEye1000,使用了算力2T的NPU, 处理器内置的玄铁810,可实现高性能,低功耗的CNN网络模型推理加速。应用于视觉AI场景,随着RISCV开源生态的发展,这种RISCV+自研NPU的架构应该会成为未来端侧推理的常见架构。DeepEye1000芯片专注边缘和端侧视觉应用,基于多核异构并行计算架构设计,内置四核神经网络处理器,可支持INT16,INT12,INT8混合精度量化数据,支持主流神经网络模型。
RK3588,RK发布新一代的性能魔兽RK3588,NPU峰值算力达到6T,这方面比我们走的更靠前一些,到了RK3588,RK的NPU已经开发到第四代,它的NPU技术来源于芯原,经过了四代演进,已经消化和吸收并形成了改进的能力,第四代NPU就是其在消化吸收的基础上对NPU做的一次性能提升。总体上,RKNN无论工具还是软件架构都类似于VIP,RKNNToolkit的功能更是和acuity toolchain如出一辙。
IP结构上面,VIP分为了NN,TP,PPU(shader)三种计算单元,卷积放在NN上执行,由于NN是硬件连线,执行效率和功耗更占优,TP则是负责内存搬运,比如池化操作放在TP上执行,还有PPU,它类似于GPU中的 Shader单元,可以通过编成实现灵活的逻辑,有专门的指令集EVIS对其进行编程,上采样算子以及反量化算子可以放上去跑。当然,RK不叫这个名字,但是也仅仅是不叫这个名字,RK分别叫做 CNA, DPU,PPU,应该是换汤不换药,功能类似。观展后总体感觉RK的异构算力整合能力是强于我们的,很多我之前听都没有听过的IP,他们已经玩儿的很6了,不过再强大的算力整合能力,也需要软件配合好
其次,中星微也发布了它们的4T NPU算力芯片,中兴微的NPU设计开发能力也比较完整,有全套的模型导入,编译,转化,量化,仿真工具。它们展示了VC07684K AI IP Camera, 具备4T的算力。它们展台前展示了一个demo,通过前端摄像头采集了一张拥有900张人头像的照片,通过NPU的目标检测算法,将检出结果框选后投屏的大屏幕上,仔细观察,召回率和精度都能达到%100.
经过咨询,它们使用的是YOLOV5S算法,如果按照标准YOLO算法处理的图像统计,网络吃图按照416*416计算,那么每张人像在NPU处理的尺寸中只占用 192个像素,这么小的区域都可以检测到,不知道是算法优化的好还是硬件做的出色。
还有一些针对特色场景的算法,比如人脸锁算法,体验上类似于手机解锁,电子门禁功能,节省了物理开锁过程,还有高空抛物算法,支持自动识别,主动预警/ 报警,坠物风险主动提示,主动溯源,灵活部署,远程运维。
芯片方面,其它的展位还参观了SOPHON(比特大陆算丰),它们展出了BM1682、BM1684号称支持3TOPS的单精度浮点算力.
因为场景大多是碎片化的,目前AI的算法很难做到通用化,必然涉及到大量的定制,而AI的基础除了算力和算法,还有数据,对算法公司来说,很多的数据都掌握在客户,或者终端运营方手里,它们也并不想分享给算法商,如果数据很有价值,客户也会自研算法,进一步挤压纯粹算法商的生存空间,所以,很多纯粹的算法公司也开始涉足芯片,涉足产品。
软件技术栈
这方面给我留下深刻印象的是涂鸦科技,它的站台产品种类非常丰富,涵盖了智能家具,智能硬件,IPC等全品类,小如防狼器,大无线视频机都有。
这些产品的额共同特点是拥有一套统一的软件栈,如下图所示,从架构图中可以看到,涂鸦只负责整个软件栈中的云平台服务部分,内涵小,外延大,在我们的软件SDK管理中,也可以参考这种做法,开源不重要的部分,核心部分,价值提供部分保持闭源,做我们自己擅长的事情,不但减轻我们的开发负担,而且充分利用客户生态资源,群策群力,扩大产品应用场景范围,
总结:
安防行业的从业人员不缺展会,北京安博会、深圳安博会、广州安博会构成了安防人相聚的三大盛会,这次观展拓宽了技术视野和产品眼界,以后有机会要多多参此类型的交流,向客户学习,向供应商学习,向同行学些。