一、动作识别的难点
1.类内和类之间差异, 同样一个动作,不同人的表现可能有极大的差异。
2.环境差异, 遮挡、多视角、光照、低分辨率、动态背景.
3.时间变化, 人在执行动作时的速度变化很大,很难确定动作的起始点,从而在对视频提取特征表示动作时影响最大
4.缺乏标注良好的大的数据集
二行为识别的两个方向
1.Action Recognition:
给定一个视频片段进行分类,一般使用的数据库都先将动作分割好了,一个视频片段中包含一段明确的动作,时间比较短。(其实就是输入一个视频,输出其动作分类)常用数据库:UCF101,HMDB51等等
2.Temporal Action Localization:
不仅要知道动作在视频中是否发生,还要知道动作发生在视频的哪段时间(开始和结束时间)。特点是处理较长的、未分割的视频。而且视频通常有较多的干扰,目标动作一般只占视频的一小部分。常用的数据库包括HUMOS2014/2015,ActivityNet。