Embedding(嵌入)是当下人工智能领域的热点,并发挥着越来越重要的作用。本书从Embedding基础概念和方法讲起,逐渐深入其原理,并以应用实例作为辅助,是快速了解并掌握Embedding的参考指南。
本书内容
全书一共16章,分为两个部分:
第一部分为Embedding基础知识(第1~9章),主要讲解Embedding的基础知识、原理以及如何让Embedding落地的相关技术,如TensorFlow和PyTorch中的Embedding层、CNN算法、RNN算法、迁移学习方法等,重点介绍了Transformer和基于它的GPT、BERT预训练模型及BERT的多种改进版本等。
第1章:万物皆可嵌入,介绍了各种各样的embedding技术。
第2章:讲解如何获取Embedding,介绍了Pytorch和Tensorflow框架中的emdding layer使用,以及如何从预训练模型中获取embedding;
第3、4章分别介绍视觉处理、文本处理方面的基础知识;包括视觉中的卷积神经网络与预训练模型,文本处理中的训练神经网络,编解码模型与序列模型。
第5章为本书重点,介绍了多种注意力机制,包括给Encoder-Decoder模型添加注意力机制,Transfromer模型详解与实现,Transfromer-XL模型详解与实现;
第6~8章介绍了ELMo、BERT、GPT、XLNet等多种预训练模型;
第9章介绍了推荐排序系统中的深度学习技术,包括卷积神经网络,transformer的使用。
第2部分(第10 ~16章)Embedding应用实例
通过6个实例介绍了Embedding及相关技术的实际应用,包括如何使用Embedding提升传统机器学习性,如何把Embedding技术应用到推荐系统中,如何使用Embedding技术提升NLP模型的性能等。
第10章介绍如何使用Embedding处理机器学习中的分类特征;
第11章介绍如何使用Embedding提升机器学习性能;
第12章介绍如何使用Transformer实现将英文翻译成中文;
第13章介绍Embedding在推荐系统中的前沿应用;
第14章介绍如何使用BERT实现中文语句分类问题;
第15章介绍如何使用GPT-2实现文本生成;
第16章是对Embedding技术的总结。
本书主要作者:
吴茂贵,资深大数据和人工智能技术专家,在BI、数据挖掘与分析、数据仓库、机器学习等领域工作超过20年。在基于Spark、TensorFlow、PyTorch、Keras等的机器学习和深度学习方面有大量的工程实践实践,对Embedding有深入研究。著有《深度实践Spark机器学习》《Python深度学习:基于TensorFlow》《Python深度学习:基于Pytorch》等多部著作,广受读者好评。
本书特色:在内容方面,本书理论与实操兼顾,一方面系统讲解了Embedding的基础、技术、原理、方法和性能优化,一方面详细列举和分析了Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践;在写作方式上,秉承复杂问题简单化的原则,尽量避免复杂的数学公式,尽量采用可视化的表达方式,旨在降低本书的学习门槛,让读者能看得完、学得会。