行为识别概况

原创

AI韬哥 2023-05-18 17:16:35 ©著作权

©著作权归作者所有：来自51CTO博客作者AI韬哥的原创作品，请联系作者获取转载授权，否则将追究法律责任

一、动作识别的难点
1.类内和类之间差异, 同样一个动作，不同人的表现可能有极大的差异。
2.环境差异, 遮挡、多视角、光照、低分辨率、动态背景.
3.时间变化, 人在执行动作时的速度变化很大，很难确定动作的起始点，从而在对视频提取特征表示动作时影响最大。
4.缺乏标注良好的大的数据集
二行为识别的两个方向
1.Action Recognition:
给定一个视频片段进行分类，一般使用的数据库都先将动作分割好了，一个视频片段中包含一段明确的动作，时间比较短。（其实就是输入一个视频，输出其动作分类）常用数据库：UCF101，HMDB51等等
2.Temporal Action Localization:
不仅要知道动作在视频中是否发生，还要知道动作发生在视频的哪段时间（开始和结束时间）。特点是处理较长的、未分割的视频。而且视频通常有较多的干扰，目标动作一般只占视频的一小部分。常用的数据库包括HUMOS2014/2015，ActivityNet。