文章目录


数据分析.numpy. 读/写文件

一、前言

Numpy中的文件读/写主要有二进制的文件读/写和文件列表形式的数据读/写两种形式。学会读写文件是numpy的基础。numpy提供了若干的函数可以把结果表存到二进制或文本文件中。除此之外,numpy还提供了许多文件读取数据并将其转换为数组的方法。

​​


二、二进制数据存储(单个数组及多个数组)

save函数对二进制的格式保存数据。

np.save(file,arr,allow_pickle=True,fix_import=True)
file 是目标文件名称,需要制定文件的路径,未设置则将保存至默认路径
arr 是目标数组,保存后的扩展名为.npy

【Python】数据分析.numpy.读/写文件_数组

如果将多个数组保存到一个文件中,则可以使用savez函数,其扩展名为.npz

【Python】数据分析.numpy.读/写文件_文本文件_02

【Python】数据分析.numpy.读/写文件_数组_03


​​


三、二进制文件读取

load函数从二进制的文件中读取数据。

load(file, mmap_mode=None, allow_pickle=True, fix_imports=True, encoding='ASCII')
file: 类文件对象或字符串格式,要读取的文件或字符串,必填,类文件对象需要支持seek()和read()方法。
mmap_mode: 内存映射模式,值域为:None、'r+''r''w+''c',选填。
allow_pickle:布尔型,选填,是否允许加载存储在npy文件中的pickled对象数组,默认值为True。
fix_imports: 布尔型,选填,如果为True,pickle将尝试将旧的Python 2名称映射到Python 3中使用的新名称,仅在Python 2生成的pickled文件加载Python 3时才有用,默认值为True。
encoding: 字符串,读取Python 2字符串时使用何种编码,选填。

【Python】数据分析.numpy.读/写文件_数组_04


​​注意:读取文件数组时的索引从0开始!

​​


四、文本文件存储与读取

  • savetxt函数可以将数组写到以某种分隔符隔开的文本文件中,loadtxt函数则相反,即把文件加载到一个二维数组中。
  • loadtxt函数与genfromtxt函数相似,不过后者面向的是结构化数组和缺失数据,常用的参数除了fname、delimiter外,还有names(是否含有列标题)
  • 【Python】数据分析.numpy.读/写文件_文本文件_05

savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='n', header='', footer='', comments='# ', encoding=None)

fname 文件名或文件句柄.如果文件名以.gz,该文件将自动以压缩的gzip格式保存。loadtxt透明地理解压缩文件。
X 类一维或二维阵列---要保存到文本文件中的数据。
fmt 可选,单一格式(%10.5F)、格式序列或多格式字符串。‘Iteration%d-%10.5F’,在这种情况下分隔符被忽视了。复杂X的法律选择FMT是:一个说明者,Fmt=%.4e’,从而生成格式类似的数字‘(%s+%Sj)%(FMT,FMT)指定每个实部和虚部的完整字符串。‘%.4e%+.4ej%.4e%+.4ej%.4e%+.4ej’3栏说明符的列表,每列一个--在这种情况下,实部和虚部必须有独立的说明符。[%.3e+%.3 ej’,‘(%.15e%+.15 ej)]2
delimiter Str,可选分隔列的字符串或字符。
newline Str,可选,字符串或字符分隔行。
header Str,可选,将在文件开头写入的字符串。
footer Str,可选,将在文件末尾写入的字符串。
comments Str,可选,字符串,该字符串将被添加到header和footer字符串,将它们标记为注释。默认值:‘#’,如G.numpy.loadtxt.
encoding {无,str},可选用于编码输出文件的编码。不适用于输出流。如果编码不是“字节”或“latin 1”,您将无法加载NumPy版本<1.14中的文件。默认值是“latin 1”。

​​

loadtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0, encoding='bytes', max_rows=None)
genfromtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_values=None, usecols=None, names=None, excludelist=None, deletechars=" !#$%&'()*+, -./:;<=>?@[\]^{|}~", replace_space='_', autostrip=False, case_sensitive=True, defaultfmt='f%i', unpack=None, usemask=False, loose=True, invalid_raise=True, max_rows=None, encoding='bytes')

【Python】数据分析.numpy.读/写文件_python_06

关于reshape(4,-1)参见了以下内容:

【Python】数据分析.numpy.读/写文件_文本文件_07