各位同学,今天有三来发布新书了,名为《深度学习之图像识别:核心算法与实战案例(全彩版)》,本次书籍为我写作并出版的第6本书籍。
前言
2019年5月份我写作了《深度学习之图像识别:核心技术与案例实战》,迄今已经重印5次,被众多读者所认可。可见如下:言有三新书预售,不贵,有料
2019年版(全黑白印刷,正文267页)
只是这是笔者第一次执笔写书,当时笔者在互联网公司上班,时间非常紧,加之自身能力不足和水平所限,所写内容还不算太成熟和完备,仍然有大量可以改进、扩展和深入的空间。近几年,笔者进一步对相关技术进行了潜心研究和实践,对相关技术有了更加深入和全面的认识,其间还出版了几本相关图书,还与大量读者和技术爱好者进行过多次线上和线下交流,并在各大平台上进行过多场直播,收集了大量的反馈和建议,因此觉得有必要重新写一本书,分享更新、更系统、更细致和更深入的计算机视觉技术。
2022年笔者终于有一段较为空闲的时间,便投入到这本书的写作中,经过大半年时间的编写,终于完成了本书的写作任务。这本书相对于2019年版,成为了一本更系统、更细致的书籍。(2019年的书已经停止印刷,不会再提供支持,请大家直接购买2023年的新书)
本次出版的新书虽然不敢说是完美的,但的确是尽最大努力去争取做到完美,从最终呈现的效果也要远好于之前出版的图书,尤其是全彩色印刷,用的纸张还非常上档次,最终呈现的效果我还是比较满意的。我想,只要我还在这个领域,这本书我一定会持续维护下去,争取把这本书做成一本内容丰富、主体很齐全、配套很超值的经典图书,让这本书成为业内有口皆碑的书。
2023年版(全彩色印刷,正文382页)
2023年版相对于2019年版的提升
在本次出版的书籍中,我们保留了2019年版本的主要目录结构,但是重点进行了几处修改,包括:将全书所有的案例统一调整为Pytorch框架代码,新增了许多图表以及关键技术细节的描述,新增了若干重要领域的应用实践代码。
具体而言,2023年版和2019年版的不同之处主要有:
- 修改:给第1章和第2章新增了大量插图,便于初学者更好地进行学习。
- 修改:给第3章新增了大量插图,将原来第7章中的数据可视化内容移动到本章。
- 修改:给第4章新增了大量插图和最新研究与应用,将案例代码统一调整为Pytorch框架格式。
- 调整:调整了目标检测与图像分割的顺序,将目标检测放置在图像分割之前,使得本书的阅读顺序更加合理。
- 修改:给第5章新增了大量插图和最新研究与应用(如添加了YOLO v4和v5等内容),将案例代码统一调整为Pytorch框架格式。
- 修改:给第6章新增了大量插图和最新研究与应用,将案例代码统一调整为Pytorch框架格式。
- 修改:将原来第7章中的数据可视化内容移动到第3章,添加了3个全新的案例实践。
- 修改:给第8章新增了大量插图和最新研究与应用,删除了原来的案例,添加了3个全新的案例实践(结构化模型剪枝,8bit模型量化,经典知识蒸馏)。
- 删除:删除了原来第9章损失函数,并将相关内容融入到其他章节中。
- 修改:优化调整了原来第10章模型部署的内容。
本书内容
本书从深度学习的背景和基础理论开始讲起,然后介绍了深度学习中的数据使用,以及计算机视觉的三大核心领域,图像分类、图像分割、目标检测,并介绍了深度学习模型的可视化、模型的优化和部署。
全书正文约382页,共计9章,目录如下:
第1章 神经网络与卷积神经网络基础
本章首先介绍了神经网络的生物基础与数学模型,然后介绍了卷积神经网络的基础知识,这也是当前深度学习模型的基础。
第2章 深度学习优化基础
本章首先介绍了深度学习优化相关的内容,包括激活函数、标准化方法、正则化方法、最优化方法、参数初始化方法等。然后介绍了深度学习主流开源框架,包括Pytorch等,并对其特点与性能做了对比;本章旨在让大家对深度卷积神经网络的优化有一个较为全面的认识,给后续章节的学习打好基础。
第3章 深度学习中的数据
本章首先介绍了深度学习发展过程中的几个数据集,给读者展示了数据集对深度学习的重要性;接着介绍了几大重要发展方向中的数据集;接着讲述了数据的收集、整理及标注、数据增强等相关问题;最后讲述了数据的可视化与分析。本章是工业项目中非常重要的环节,也是实践性很强的内容。
第4章 图像分类
本章首先介绍了图像分类的基础、然后详细介绍了图像分类的各个研究领域,包括多类别图像分类,细粒度图像分类,多标签图像分类,半监督与无监督图像分类,零样本图像分类;在案例实践部分,首先以一个从零搭建的图像分类模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分类任务的实践流程;然后介绍了一个细粒度级别的图像分类任务,以一个较好的基准模型,展示了较难的图像分类任务特点以及模型训练调优。
第5章 目标检测
本章首先介绍了目标检测的基础和基本流程,并讲述了一个经典的V-J目标检测框架;然后介绍了基于深度学习的目标检测任务的研究方法与发展现状,并重点总结了其中的二阶段目标检测方法与一阶段目标检测方法;最后给出了一个目标检测任务实践,使用当下比较主流的YOLO系列中的YOLO v3框架来进行模型训练与测试。
第6章 图像分割
本章首先介绍了图像分割基础与研究方向,简单回顾了经典的图像分割方法;然后介绍了基于深度学习的图像分割方法的基本原理与核心技术,并重点总结了语义分割模型、实例分割模型、Image Matting模型;在案例实践部分,以一个从零搭建的图像分割模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分割任务的实践流程;然后介绍了一个更加复杂的人像软分割任务,展示了典型Image Matting框架的代码实现与模型训练。
第7章 模型可视化
本章首先对深度学习中的模型结构可视化做了介绍,然后对具有代表性的模型可视化分析方法进行了介绍;在案例实践部分,分别对梯度法可视化、反卷积可视化、激活热图可视化方法进行了代码分析与实践。
第8章 模型压缩
本章首先介绍了轻量级模型设计的代表性方法,然后依次详细介绍了模型剪枝、模型量化、模型蒸馏的代表性模型;在案例实践部分,分别进行了基于缩放因子的结构化模型剪枝、基于KL散度的8bit模型量化、以及经典的知识蒸馏框架的代码实现与模型训练和压缩。
第9章 模型部署
本章依托微信小程序平台从3个方面介绍了模型部署的问题。首先介绍了微信小程序的前端开发基础,然后介绍了微信小程序的服务端开发基础,最后介绍服务端算法功能代码的实现,完成了一个可供所有读者验证的工业级线上模型的部署。
详细内容请大家直接阅读书籍。本书内容由浅入深,讲解图文并茂,紧随工业界和学术界的最新发展,理论和实践紧密结合,给出了大量的图表与案例分析。本书抛开了过多的数学理论,完整地剖析了深度学习在图像识别领域中各个维度的重要技术,而不是只停留于理论的阐述和简单的结果展示,更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习,将会对深度学习领域的图像识别技术和其在实际开发中的应用有更深的理解。本书所有实战代码统一使用Pytorch框架,适合新手使用学习。
本书内容邀请了业内资深专家进行阅读,并获得了推荐,推荐语如下:
——中国科学院半导体研究所研究员 鲁华祥
本书作者是一位在深度学习图像识别领域工作多年的有为青年,他根据自己的工作经历和经验编写了本书。本书以理论结合案例的方式系统地介绍计算机视觉中的图像分类、目标检测和图像分割几个核心方向的研究方法,并对模型的可视化分析和压缩方法进行比较深入的介绍,是一本不可多得的图像识别技术读物,推荐给那些对深度学习和图像识别技术感兴趣的人阅读,一定大有裨益。
——阿里巴巴达摩院计算机视觉大模型负责人 赵德丽
本书对深度学习的基础知识做了详细的介绍,并且配了大量的示意图,做到了图文并茂,读起来通俗易懂。本书知识和实践并重,结合多个具体的应用案例讲解,适合学习深度学习基础知识和常见理解类任务的读者阅读。本书作者著有多本相关技术图书,经验丰富,相信这本图像识别类的图书也会给AI的普及带来助力。
——虾皮技术总监 陈强
一个好的算法工程师必须要有扎实的理论基础和丰富的实战经验。本书重点介绍了计算机视觉领域近几年的一些新进展,另外还详细地阐述了如何完成工业界的一些实用且通用的视觉任务。如果你想要成为一名计算机视觉算法工程师,那么建议你系统地阅读本书,在作者的引领下提高自己的水平。
——高途AI算法负责人 邱学侃
随着多模态大模型的技术发展,AI的能力在不断进化,我们马上就要进入真正的AI时代。以感知世界为目标的视觉图像分析算法为切入口,言有三的这本书是我们学习AI技术的一个很好的敲门砖,该书对图像识别领域中多个实际任务的数据集、任务目标、基本方法和工具框架都进行了详细介绍。读者朋友可以通过阅读本书快速理解深度学习的基础概念和理论,并能够根据相关的实战案例介绍亲自动手实践,从而提高学习效率,提升学习效果。