本文将介绍计算机视觉相关的经典书籍,顶级期刊/会议,在线学习课程,常用开源库和安利小工具等。

** 简介**

计算机视觉(Computer Vision)

计算机视觉是一个跨学科领域, 涉及如何使计算机能够获得从数字图像或视频的高层次理解。从工程学的角度来看, 它寻求自动化人类视觉系统可以做的任务。

Reference:https://en.wikipedia.org/wiki/Computer_vision

计算视觉相关条目

Outline of computer vision

Reference:https://en.wikipedia.org/wiki/Outline_of_computer_vision

Category:Computer vision

Reference:https://en.wikipedia.org/wiki/Category:Computer_vision

经典书籍 《Multiple View Geometry in Computer Vision》Second Edition

计算机视觉中的一个基本问题是了解真实世界场景的几个图像的结构。解决这个问题的技术来自投影几何和摄影测量。在这里,作者按照相机投影矩阵,基本矩阵和三焦张量来描述几何原理和它们的代数表示。这些实体的计算理论和方法都是用实例来讨论的,正如它们用于重建多个图像的场景一样。新版本的特点是对书中的关键概念进行了扩展介绍(本书已经更新了其他示例和附录)以及自第一版以来出现的重要新结果。提供了全面的背景材料,因此熟悉线性代数和基本数值方法的读者可以理解所提出的投影几何和估计算法,并直接从书中实现算法。

注:理解3D到2D变换的必备书籍,如homography推导

Reference:http://www.robots.ox.ac.uk/~vgg/hzbook/

《Computer Vision: Algorithms and Applications》

此书是计算机视觉的圣经,介绍CV诸多方向,内容很全,十分适合作为入门和进阶书籍。介绍的内容有特征检测、匹配,分割,SFM,图像拼接,立体视觉,三维重建等。

Reference:http://szeliski.org/Book/

《Computer Vision: Models, Learning, and Inference》

本书也是计算机视觉经典书籍,其以最小的先决条件为基础,从概率和模型拟合的基本知识入手,并提供可供读者实施和修改以构建有用视觉系统的实例。主要面向高级本科生和研究生,详细的方法论演示对计算机视觉从业者也很有用。 本书涵盖尖端技术,包括图形切割,机器学习和多视图几何的方法,显示重要计算机视觉问题的解决方案,例如相机校准,人脸识别和对象跟踪,描述了70多种算法。

Reference:http://www.computervisionmodels.com/

《An Invitation to 3d vision》

本书介绍了三维视觉的几何结构,即从一系列二维图像重建物体的三维模型。 它详细描述了两个视图几何的经典理论。

Reference:http://vision.ucla.edu/MASKS/

《Concise Computer Vision: An Introduction into Theory and Algorithms》

本书重点突出重要算法和数学概念的作用。

Reference:http://www.springer.com/us/book/9781447163190

《Robot Vision》

This book presents a coherent approach to the fast moving field of machine vision, using a consistent notation based on a detailed understanding of the image formation process.

Reference:https://mitpress.mit.edu/books/robot-vision

《Computer Vision: A Modern Approach》

《Learning OpenCV》

OpenCV1.x教材书,本书于2008年出版(有中文版),是OpenCV1.x最佳书籍,早期学习OpenCV的程序员必备书籍。

Reference:http://it-ebooks.info/book/299/

《Learning OpenCV3》

OpenCV3.x教程书,本书于2016年出版(目前还没有中文版),是OpenCV3.x最佳书籍,现在学习OpenCV的程序可选书籍。

Reference:http://shop.oreilly.com/product/0636920044765.do

《数字图像处理》冈萨雷斯

顶级CV期刊/会议 期刊

TPAMI:https://www.computer.org/web/tpami

IJCV:https://link.springer.com/journal/11263

会议

CVPR:http://cvpr2018.thecvf.com/

ICCV :http://iccv2017.thecvf.com/

ECCV :https://eccv2018.org/

SIGGRAPH :https://www.siggraph.org//

NIPS:https://nips.cc/

在线学习课程 Annotated Computer Vision Bibliography: Table of Contents:超全的计算机视觉知识网址,罗列近20年的知识(目前还在更新中)

Reference:http://www.visionbib.com/

CVonline:非常全面的资源链接

Reference:http://homepages.inf.ed.ac.uk/rbf/CVonline/

CS131: Computer Vision: Foundations and Applications

Reference:http://vision.stanford.edu/teaching/cs131_fall1718/

CS231n: Convolutional Neural Networks for Visual Recognition

非常好的教程,CV与DL结合,深入浅出!

Reference:http://cs231n.stanford.edu/CS231M: Mobile Computer Vision

CSE576: Computer Vision

Reference:http://courses.cs.washington.edu/courses/cse576/08sp/

Learn OpenCV

Reference:https://www.learnopencv.com/

常用开源库 OpenCV:计算机视觉库(支持C++/Python)

Reference:https://opencv.org/

EmguCV:主要支持.NET语言,如C#/VB/VC++

Reference:http://www.emgu.com/wiki/index.php/Main_Page

TensorFlow:TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。

Reference:https://www.tensorflow.org/

Caffe:Caffe,全称Convolutional Architecture for Fast Feature Embedding。是一种常用的深度学习框架,在视频、图像处理方面应用较多。

Reference:http://caffe.berkeleyvision.org/

Caffe2:Caffe2 aims to provide an easy and straightforward way for you to experiment with deep learning and leverage community contributions of new models and algorithms. You can bring your creations to scale using the power of GPUs in the cloud or to the masses on mobile with Caffe2's cross-platform libraries.

Reference:https://caffe2.ai/

Pytorch:PyTorch是使用GPU和CPU优化的深度学习张量库。

Reference:http://pytorch.org/

Torch:Torch is a scientific computing framework with wide support for machine learning algorithms that puts GPUs first. It is easy to use and efficient, thanks to an easy and fast scripting language, LuaJIT, and an underlying C/CUDA implementation.

Reference:http://torch.ch/

MxNet:一个用于深度学习的灵活且高效的库

Reference:http://mxnet.incubator.apache.org/index.html

Theano:Theano是一个Python库, 它允许你有效地定义、优化和评估涉及多维数组的数学表达式。

Reference:http://deeplearning.net/software/theano/

Keras:Keras 是一种高层次的神经网络 API,它以 Python 编写,能够在 TensorFlow、CNTK 或 Theano上运行。

Reference:https://keras.io/

Dlib:Dlib 是一个c++工具包,包含机器学习算法和工具,用于在 c++中创建复杂的软件以解决现实世界中的问题。它在工业和学术界都有广泛的应用,包括机器人、嵌入式设备、移动电话和大型高性能计算环境。Dlib 的开源授权允许您在任何应用程序中免费使用它。

Reference:http://dlib.net/

安利小工具

Google Scholar:强大的论文搜索引擎

Reference:https://scholar.glgoo.org/

arXiv.org:最新的论文刊登平台

Reference:https://arxiv.org/list/cs.CV/recent

Library Genesis:很好用的搜索英文电子书的网站Library Genesis

Reference:http://gen.lib.rus.ec/

PAMITC:汇集WACV,CVPR和ICCV

Reference:http://www.pamitc.org/

awesome-computer-vision:github上关于CV方向超全面的资料库,涵盖常用书籍,课程,期刊/会议,软件,数据集和博客等。

Reference:https://github.com/jbhuang0604/awesome-computer-vision