体育运动动作识别是通过在时域上跟踪一些关键点的运动以记录人体运动,并转换为可用的数学方式表达运动的过程,对于竞技训练和全民健身均具有重要意义。传统的动作识别技术有机械式、声学式、电磁式、光学式等。机械式技术采用外置传感器和刚性支架,会影响肢体活动。声学式和电磁式技术则存在易受外界环境干扰、有较大时间延迟、测试精度不高等问题。传统的光学式技术较为精准,但也存在价格昂贵、数据处理耗时较长等不足。近年来,基于加速度计、陀螺仪、磁力计等惯性测量技术和基于肌电图的可穿戴技术发展迅速,但也存在设备可能影响运动表现、无法在比赛环境中使用等局限。
计算机视觉利用摄像机和计算机对目标进行捕捉、跟踪、测量,并通过人工智能算法实现动作自动识别,突破了传统动作识别技术的诸多局限。2019年,澳大利亚学者Cust等总结了机器学习在动作识别中的应用,系统汇总了支持向量机(SVM)、卷积神经网络(CNN)等算法在计算机视觉中的应用。值得关注的是,一些新的姿态估计算法不断涌现。OpenPose是当前最常用的多人人体姿态估计算法之一,采用自底向上的方法,首先检测出图像中所有人的关键点,然后将检出的关键点分配给每个对应的人。RMPE(AlphaPose)是一种自顶向下的姿态估计算法,通过使用对称空间变换网络(SSTN)从不准确的候选框中抽取高质量的单人区域。Mask RCNN作为一个流行的语义和实例分割架构,可同时预测图像中多个物体的候选框位置,并分割其语义信息的掩码,从而确定每个人的位置,再通过位置信息和特征点集合识别人体运动姿态。
从普通相机到深度相机,从固定区域到无限区域,从固定视角到自由视角,从单人捕捉到多人识别,从单一技术到计算机视觉、惯性传感器、肌电图、虚拟现实等技术的交叉融合,技术在不断革新。计算机视觉在体育中的应用也有望从动作识别逐渐向运动效果智能评估、技战术智能分析、运动损伤智能预测等领域拓展和深入,推动体育运动的智能化发展。