‍‍

新手速递!深度学习视频理解!_深度学习

视频理解是当前计算机视觉研究领域中备受学术界和工业界关注的方向,随着视频行业的高速发展,如何利用 AI 技术更好地对视频内容进行理解变得越来越重要。今天要给大家介绍的书是深度学习视频理解》。

本书内容

本书对视频理解的3个重要领域进行介绍,对于每个领域,本书不仅解释了相关算法的原理,还梳理了算法演进的脉络。

新手速递!深度学习视频理解!_人工智能_02

全书共分6章。

第1章:绪论,简要介绍视频行业的发展历程,动作识别,时序动作定位,视频Embedding技术。

新手速递!深度学习视频理解!_人工智能_03

第2章:经典网络结构回顾,回顾经典图像分类模型和RNN。

新手速递!深度学习视频理解!_机器学习_04

第3章,基于2D卷积的动作识别,包括基本的平均汇合法,RNN模型,双流法,时序稀疏采样。

新手速递!深度学习视频理解!_深度学习_05

第4章:基于3D卷积的动作识别,包括基本模型C3D,双流Infalted 3D模型,3D卷积的低秩近似,时序位移模型TSM等。

新手速递!深度学习视频理解!_算法_06

第5章:时序动作定位,介绍时序动作检测相关的重要算法,包括基于滑动窗的方法,基于候选时序区间的算法,自底向上与时序结构信息建模的方法等。

新手速递!深度学习视频理解!_人工智能_07

第6章:视频Embedding,介绍视频Embedding另一的重要算法,包括Word2Vec,Item2Vec等。

新手速递!深度学习视频理解!_人工智能_08

附录:总结了常用的一些视频处理工具,包括FFmpeg,OpenCV,Decord,Lintel。

本书作者张皓,毕业于南京大学计算机系周志华教授领导的机器学习与数据挖掘研究所(LAMDA),导师为吴建鑫教授,研究方向为深度学习和计算机视觉,曾获国家奖学金、江苏省三好学生等荣誉

本书是一本综合介绍新的基于深度学习的视频理解算法的参考书,通过理论与实践相结合的形式详细介绍了视频理解中的识别、定位、特征表示等诸多重点任务和方法。对该领域的研究者和从业者都非常实用。


新手速递!深度学习视频理解!_算法_09