推荐指数:★★★☆☆
介绍数据分析的相关知识和流程,主要讲怎么利用Python导入数据、操作数据、输出数据和绘制各种数据图表。优点是小白就可以学,从零开始简单易懂。缺点是不够深入,知其然不知其所以然。下面是个人总结的一些内容(其实是对着书复习一遍,毕竟看完就忘了):
这里说明一下,本人学过Java,但只是学过,Python更是初学咋练,如果有错漏的地方,请不吝指正,万分感谢!
一、推荐使用Anaconda/Jupyter Notebook进行python编程
作者推荐使用Anaconda学习python,个人感觉还是不错的,因为后面学习《简明Python》安装了JetBrains PyCharm(专业版),对比起来要方便很多。基本就像下面:
(1)Anaconda的控制台命令窗口,这个要保持运行。
(2)下面是编程界面,具体操作不说了,展示一下,大家自己感觉。
这里补充几个常用的快键:
- 注释:
1)选中内容按Ctrl+/
2)'''要注释的内容‘'',这种方法的好处在于,可以使用__doc__(注意前后都是两个下划线)方法调用出来。
- 快速生成下一个编辑窗口
Alt+Enter(效果如下图GIF)
大家也可以看到,__doc__的用法。python里面不管函数也好、类也好还是其他什么,都可以看作是对象,__doc__就是默认的一个属性了,可以直接调用。
- 提示符
就是Tab键,类似Java的点方法。
- 其他的快键我目前用的不多,大家可以自己点开看看。
另外使用Anaconda有时候你点了运行,会发现没啥反应没运行结果,这个时候最好重启下服务。
二、基础概念
这部分介绍的就是一些基本概念性的东西。我说几个个人感觉有用的:
- “ ”与’ ‘:这本书里没有说明,简明Python说的挺明白:作用和用法完全一样,也就是用" "的地方就可以用’ ‘,用哪个都可以。
- 函数块:其实这个表达不怎么准确,python的缩进比较严谨,函数块用冒号(:)表明。
- 比较重要的,数据结构:
- 列表-list,例如:l = [],这就生成了一个列表。
- 字典-dict,例如:d = {},特点是键值对,d = {[“张三”,1101],["李四",1102]}。
- 元组-tup,例如:t = ()
- Pandas
- Series
- DataFrame
- map()函数
- zip()函数:将可迭代的对象打包为元组,返回由这些元组(tup)组成的列表(list)。
1 >>>list_a = [1,2,3,4]
2 >>>list_b = [a,b,c,d]
3 >>>for i in zip(list_a,list_b):
4 print(i)
5 (1,'a')
6 (2,'b')
7 (3,'c')
8 (4,'d')
9 上述以list为例,如改成下属代码,结果一样。
10 >>>list_a = (1,2,3,4)
11 >>>list_b = (a,b,c,d)
12 >>>for i in zip(list_a,list_b):
13 print(i)
其实就是1-3三种,回头一看,就是括号不一样(汗~),大括号字典,中括号列表,小括号元组。
三、获取数据
就是导入外部数据了,主要是Excel。使用的是Pandas的read_x()方法,例如:
import pandas as pd
df = pd.read_excel(r"C:\Users\admin\Desktop\测试.xls")
df
这里有两点:
1)运用r(转义符),不用的话就把\改/。
2)如果你像我一样报下图这个错误,那么你可能是把从桌面复制的文件路径直接丢到了代码里,你可以试着转换一下,比如先复制到QQ聊天框,再复制到代码里,就OK了。
个人感觉这个是格式的问题,但是在网上找了下,不太好描述问题,所以没发现答案,如果哪位朋友了解,请帮忙解惑。
OK,本次的学习内容总结到此就先到这里了。