dbever导入csv文件到mysql dbeaver导入csv_oracle数据泵导入导出

python 数据导入、导出

--学习导入csv、txt、excel文件学习笔记

  • 导入csv文件
import pandas as pddata=pd.read_csv(filepath_or_buffer,sep=',',names=None,engine=None,encoding=None,na_values=None)

参数及说明

filepath_or_buffer

文件路径或输入对象

sep=','

分隔符,因为是读取csv文件,所以默认为逗号

names=None

读取哪些列和指定列顺序,默认按顺序处理所有列

engine=None

文件路径包含中文的时候,需要设置engine='python'

encoding=None

文件编号,默认使用计算机操作系统的文字编码

na_values=None

指定空值,例如可指定null,NULL,NA等为空值

#数据导入import pandas as pddata=pd.read_csv('d:/python/out/data.csv',engine='python')data
import pandas as pddf=pd.read_csv('d:/python/out/Bubble_Data.csv',sep=",",header=0,index_col=None,encoding="utf8")df
  • 导入txt文件
import pandas as pddata=pd.read_table(filepath_or_buffer,sep='\t',names=None,engine=None,encoding=None,na_values=None)

参数及说明

filepath_or_buffer

文件路径或输入对象

sep='\t'

分隔符,默认为制表符

names=None

读取哪些列和指定列顺序,默认为按顺序处理所有列

engine=None

文件路径包含中文的时候,需要设置engine='python'

encoding=None

文件编码,默认使用计算机操作系统的文字编码

na_values=None

指定空值,例如可指定null,NULL,NA等为空值

import pandas as pddata=pd.read_table('d:/python/out/data1.txt',names=['name','age'],sep=',',encoding='utf8')data
  • 导入excel文件
import pandas as pddata=pd.read_excel(filepath_or_buffer,sheet_name=0,names=None)

参数及说明

filepath_or_buffer

文件路径或者输入对象

sheet_name=0

要读取的sheet表格,默认为第一个表格

names=None

读取哪些列和指定顺序,默认为按顺序处理所有列

import pandas as pddf=pd.read_excel("d:/python/out/data.xlsx",shee_tname='data',header=0)df
  • 数据导出
import pandas as pddf=pd.DataFrame.to_csv(filepath_or_buffer,sep=',',index=True,header=True,encoding='utf8')

参数及说明

filepath_or_buffer

sep=','

index=True

header=True

encoding='utf8'

#数据导入import pandas as pddata=pd.read_csv('d:/python/out/data.csv',engine='python')data
import pandas as pddf=pd.read_excel("d:/python/out/data.xlsx",sheet_name='data',header=0)df.to_excel("d:/python/out/data1.xlsx",sheet_name='data',index=False)df

学习小结:

数据可视化需要从外部导入数据,再根据需要完成绘图展现,学习使用函数导入不同格式的数据。

csv格式数据导入、导出:

使用pd.read_csv()函数,可以读入csv格式数据,并以DataFrame形式存储。根据读取数据文件编码格式,设置encoding参数(utf8、gbk等)编码方式,导入数据如果有符号,需要根据所读取的数据文件列之间的分隔方式设定delimiter参数;

使用to_csv()函数,可以将DataFrame的数据存储为csv文件;

txt格式数据导入、导出

使用np.loadtxt()函数加载数据,需要注意txt文件中的每一行必须含有相同数量的数据。

使用numpy.savetxt(fname,X)函数可以将ndarray数组保存为txt格式文件。

excel格式文件导入、导出

使用pd.read_excel()函数和to_excel()函数分别读取与导出excel数据。

sheen_name指定页面sheet,默认0,header指定列名,默认0即读取第一行,index=False表示忽略索引列。