python 数据导入、导出
--学习导入csv、txt、excel文件学习笔记
- 导入csv文件
import pandas as pddata=pd.read_csv(filepath_or_buffer,sep=',',names=None,engine=None,encoding=None,na_values=None)
参数及说明
filepath_or_buffer
文件路径或输入对象
sep=','
分隔符,因为是读取csv文件,所以默认为逗号
names=None
读取哪些列和指定列顺序,默认按顺序处理所有列
engine=None
文件路径包含中文的时候,需要设置engine='python'
encoding=None
文件编号,默认使用计算机操作系统的文字编码
na_values=None
指定空值,例如可指定null,NULL,NA等为空值
#数据导入import pandas as pddata=pd.read_csv('d:/python/out/data.csv',engine='python')data
import pandas as pddf=pd.read_csv('d:/python/out/Bubble_Data.csv',sep=",",header=0,index_col=None,encoding="utf8")df
- 导入txt文件
import pandas as pddata=pd.read_table(filepath_or_buffer,sep='\t',names=None,engine=None,encoding=None,na_values=None)
参数及说明
filepath_or_buffer
文件路径或输入对象
sep='\t'
分隔符,默认为制表符
names=None
读取哪些列和指定列顺序,默认为按顺序处理所有列
engine=None
文件路径包含中文的时候,需要设置engine='python'
encoding=None
文件编码,默认使用计算机操作系统的文字编码
na_values=None
指定空值,例如可指定null,NULL,NA等为空值
import pandas as pddata=pd.read_table('d:/python/out/data1.txt',names=['name','age'],sep=',',encoding='utf8')data
- 导入excel文件
import pandas as pddata=pd.read_excel(filepath_or_buffer,sheet_name=0,names=None)
参数及说明
filepath_or_buffer
文件路径或者输入对象
sheet_name=0
要读取的sheet表格,默认为第一个表格
names=None
读取哪些列和指定顺序,默认为按顺序处理所有列
import pandas as pddf=pd.read_excel("d:/python/out/data.xlsx",shee_tname='data',header=0)df
- 数据导出
import pandas as pddf=pd.DataFrame.to_csv(filepath_or_buffer,sep=',',index=True,header=True,encoding='utf8')
参数及说明
filepath_or_buffer
sep=','
index=True
header=True
encoding='utf8'
#数据导入import pandas as pddata=pd.read_csv('d:/python/out/data.csv',engine='python')data
import pandas as pddf=pd.read_excel("d:/python/out/data.xlsx",sheet_name='data',header=0)df.to_excel("d:/python/out/data1.xlsx",sheet_name='data',index=False)df
学习小结:
数据可视化需要从外部导入数据,再根据需要完成绘图展现,学习使用函数导入不同格式的数据。
csv格式数据导入、导出:
使用pd.read_csv()函数,可以读入csv格式数据,并以DataFrame形式存储。根据读取数据文件编码格式,设置encoding参数(utf8、gbk等)编码方式,导入数据如果有符号,需要根据所读取的数据文件列之间的分隔方式设定delimiter参数;
使用to_csv()函数,可以将DataFrame的数据存储为csv文件;
txt格式数据导入、导出
使用np.loadtxt()函数加载数据,需要注意txt文件中的每一行必须含有相同数量的数据。
使用numpy.savetxt(fname,X)函数可以将ndarray数组保存为txt格式文件。
excel格式文件导入、导出
使用pd.read_excel()函数和to_excel()函数分别读取与导出excel数据。
sheen_name指定页面sheet,默认0,header指定列名,默认0即读取第一行,index=False表示忽略索引列。