:数据科学、人工智能从业者的在线大学。数据科学(Python/R/Julia)数据分析、机器学习、深度学习 Q群:874447702
之前我们画各种图,都是把需要分析的数据,手写输入Python的开发工具中去的,这样做是为了学习和理解Python数据可视化画图的原理,但是在实际工作中,我们一定是去处理Python开发工具之外的一些数据,比如Excel表格保存的数据,或者其他格式的文件保存的数据。我们只需要用Python去读取和处理这些外部文件的数据,而不必把这些数据一个一个手动输入到Python开发工具中。
今天我们学习用Python读取和处理外部的csv格式的数据。csv是Comma-SeparatedValues的简写,意思是逗号分隔值,就是数据之间用逗号隔开,当然数据之间的分隔符不仅仅限于逗号,还可以是其他字符,它是一种经典的数据格式。
由于不同的平台,文件保存的格式会有差别,比如说同样的数据,在mac电脑和windows电脑上,分别把这些数据编写成表格文件存储,用来保存数据的软件是不一样的,比如在mac电脑上保存数据使用Numbers这个软件,在Windows电脑上保存数据使用的是Excel这个软件,所以同样的数据,从mac平台的电脑的Numbers软件保存的文件,拿到windows平台的电脑的Excel上,就不兼容了。
而数据保存为csv格式,是兼容所有平台的。
下面我们编写一个csv格式的文件。
我们大多数人应该用的都是windows电脑,我们在桌面创建一个名叫example_csv.txt的文件,txt文件就相当于没有任何格式的文件。
我们看到,数值之间用逗号隔开就是csv格式的数据。
接下来我们在Python开发工具Spyder中引入example_csv.txt文件的数据,并画出一个折线图。代码如下:
代码说明:
numpy是Python的另一个第三方库,是一个专门用来处理数据的库。
np.loadtxt是用numpy引入外部数据的文件。
loadtxt的第一个参数,是引入数据文件的路径。
loadtxt的第二个参数,是每一组数据的分隔符,我们引入的是csv格式
的数据,所以分隔符就是“,”。
loadtxt的第三个参数unpack,相当于是拆开每一组数据,并分别注入给x和y。
在这个csv文件里,每一行用逗号隔开的数据,1,3是一组数据,7,5是一组数据,...
代码运行结果:
代码运行结果绘制的图形
以上就是用Python导入外部csv数据并绘制折线图的过程。