(1)文件管理的相关库
os:该模块为操作系统接口模块,提供了一些方便使用操作系统的相关功能函数,在读写文件时比较方便。
(2)时间和日期
time:该模块为时间的访问和转换模块,提供了各种时间相关的函数,方便时间的获取和操作。
(3)文本处理
re:该库为正则表达式操作库,提供了与Perl语言类似的正则表达式匹配操作,方便对字符串的操作。
string:该库作为常用的字符串操作库,提供了对字符串操作的方便用法。
requests:requests是Python HTTP库,方便对网页链接进行的一系列操作,包括很多字符串处理的操作。
(4)科学计算和数据分析类
Numpy:NumPy是使用Python进行科学计算的基础库,包括丰富的数组计算功能,并且pytorch中的张量和numpy中的数组相互转换非常方便。
pandas:该库提供了很多高性能、医用的数据结构和数据分析及可视化工具。
statsmodels:该库常用语统计建模和计量经济学,如回归分析、时间序列建模等。
(5)机器学习类
sklearn:该库是常用的机器学习库,包括多种主流机器学习算法。
sklearn.datasets:提供了一些已经准备好的数据集,方便建模和分析。
sklearn.preprocessing:提供了多种对数据集的预处理操作,如数据标准化等。
sklearn.metrics:提供了对聚类、分类及回归效果的相关评价方法,如计算预测精度等。
sklearn.model_selection:sklearn中的此模块提供了方便对那模型进行选择的相关操作。
copy:提供复制对象的相关功能,可以用于复制模型的参数。
(6)数据可视化类
matplotlib:Python中最常用的数据可视化库,可以绘制多种简单和复杂的数据可视化图像,如散点图、折线图、直方图等。
seaborn:它是一个基于Python中matplotlib的可视化库。它提供了一个更高层次的绘图方法,可以使用很少的程序绘制有吸引力的统计图形。
hiddenlayer:可用于可视化基于pytorch、TensorFlow和Keras的网络结构及深度学习网络的训练过程。
PyTorchViz:通常用于可视化pytorch建立的深度学习网络结构。
tensorboardX:可以通过该库将pytorch的训练过程等时间写入TensorBoard,这样可以方便地利用tensorboard来可视化深度学习的训练过程和相关的中间结果。
wordcloud:通过词频来可视化词云的库,方便对文本的分析。
(7)自然语言处理
nltk:它是Python的自然语言处理工具包,是NLP领域中最常使用的一个Python库,而且背后有非常强大的社区支持。
jieba:jieba是针对中文分词最常用的分词工具,其提供了多种编程语言的接口,包括Python。可以使用该库对中文进行分词等一系列的预处理操作。
(8)图像操作
pillow:pillow是一个对PIL友好的分之,是Python中常用的图像处理库,Pytorch的相关图像操作也是基于pillow库。
cv2:OpenCV是一个C++库,用于实时处理计算机视觉方面的问题,涵盖了很多计算机视觉领域的模块,cv2是其中一个Python接口。
skimage:用于图像处理的算法集合,提供了很多方便对图像进行处理的方法。