Python 简单说明与数据结构
Python 作为 “国内” 较流行的高级语言,具有代码容易理解、专注解决问题、混合编译其他语言的优点。
变量
变量是一个最基本的储存单位,它暂时性储存coder放进去的信息。
>>>answer = 42 # 变量名(标识符) 赋值(赋值符) 变量值(值)
注意:Python 对大小写敏感、缩进为四个空格。
>>>print(answer)#将变量名(需打印的对象)放入括号内
注意:Python 中变量、数字不需要括号。字符串需要括号:print(str("内123容")) print(int(123))
>>>num = 123
>>>string = "123"
>>>print(num + string)
TypeError: unsupported operand type(s) for +: 'int' and 'str'
>>>string2 = int(string)
>>>print(num + string2)
246
注意:Python 中只有相同的数据类型才能"+"相加,num(num)转成str(num)则被当作string处理,可以字符串合并(当然俩个 str("string") 本身就可以合并。
BTW:
% 取模 - 除法的余数
** 幕 - x的y次幕 -eq pow(x,y)
// 取整余 - 商的整数部分
字符串
>>>import bs4
>>>import requests
>>>response = requests.get("http://www.irabe.me")
>>>response.encoding = "utf-8"
>>>soup = bs4.BeatifulSoup(response.text,'lxml')
>>>text = soup.select("body > div.rabbit > a")
>>>print(r'''
上面是一段基本完整的 webScraping 代码
'command' -eq '完整的代码集'
"string" -eq "单独的字符串"
\'\'\'string\'\'\' \'\'\'note\'\'\'
'''
注意:r'''string'' 可以无限换行,"\" 是转义符。"/" 是换行符
>>>word = 'friends'
>>>find_the_evil_in_your_friends = word[0]+word[2:4]+word[-3:-1]
>>>fiend
BTW:
:: -eq "friends"
0 -eq "f"
:1 -eq "fr"
-2: -eq "ds" -ne ":-2"
1:2 -eq "ri" -ne "ir"
-1:-3 -eq "nds" -ne "sdb"
函数
)
function(arg1=1,arg2=2)
对应的参数传入方式被称作是“关键词参数”。
function(1,2)
直接的传入参数的方式被称作为“位置参数”。
首先:举个栗子并且列出图表,后有详细。
集合、字典- > {}
列表- > []
元组- > ()
print("{}this is {}".format("Say:","test"))
[::]
.format("Say:","test")
列表 list--------- [word1,word2,word3,etc]
元素可变、位置有序、包容万象
可以索引,可以切片
list.insert(0,"a")、list.append("a")
list.remove("a")、list.pop[0] del list[0]
list[0]=“b”
可查
元组 tuple--------- (url=new,“w”)
除无法修改,其他和列表一致
可以索引,可以切片
字典 dict --------- {first:word1,second:word,etc}
数据键值对出现
键不重复,不可变、值可重复可变
可以索引,不可以切片
dict["New"]="Newsomething"
del dict["New"]
可查
集合 set--------- {word1,word2,word3,etc}
集合元素仅可删减与添加
不可以索引,不可以切片
a={1,2,3,4,5}
a.add("5")
a.discard("5")
一、第一句Python代码
在 /home/dev/ 目录下创建 hello.py 文件,内容如下:
执行 hello.py 文件,即: python /home/dev/hello.py
python内部执行过程如下:
二、解释器
上一步中执行 python /home/dev/hello.py 时,明确的指出 hello.py 脚本由 python 解释器来执行。
如果想要类似于执行shell脚本一样执行python脚本,例: ./hello.py,那么就需要在 hello.py 文件的头部指定解释器,如下:
如此一来,执行: ./hello.py 即可。
ps:执行前需给予 hello.py 执行权限,chmod 755 hello.py
三、内容编码
python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。
显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多
UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...
所以,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),如果是如下代码的话:
报错:ascii码无法表示中文
改正:应该显示的告诉python解释器,用什么编码来执行源代码,即:
四、注释
当行注视:# 被注释内容
多行注释:""" 被注释内容 """
五、执行脚本传入参数
Python有大量的模块,从而使得开发Python程序非常简洁。类库有包括三中:
Python内部提供的模块
业内开源的模块
程序员自己开发的模块
Python内部提供一个 sys 的模块,其中的 sys.argv 用来捕获执行执行python脚本时传入的参数
六、 pyc 文件
执行Python代码时,如果导入了其他的 .py 文件,那么,执行过程中会自动生成一个与其同名的 .pyc 文件,该文件就是Python解释器编译之后产生的字节码。
ps:代码经过编译可以产生字节码;字节码通过反编译也可以得到代码。
七、变量
1、声明变量
上述代码声明了一个变量,变量名为: name,变量name的值为:"wupeiqi"
变量的作用:昵称,其代指内存里某个地址中保存的内容
变量定义的规则:
变量名只能是 字母、数字或下划线的任意组合
变量名的第一个字符不能是数字
以下关键字不能声明为变量名
['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']
2、变量的赋值
[
#!/usr/bin/env python
# -*- coding: utf-8 -*-
name1 = "wupeiqi"
name2 = "alex"
[
[
#!/usr/bin/env python
# -*- coding: utf-8 -*-
name1 = "wupeiqi"
name2 = name1
八、输入
输入密码时,如果想要不可见,需要利用getpass 模块中的 getpass方法,即:
九、流程控制和缩进
需求一、用户登陆验证
需求二、根据用户输入内容输出其权限
外层变量,可以被内层变量使用
内层变量,无法被外层变量使用
十、初识基本数据类型
1、数字
2 是一个整数的例子。
长整数 不过是大一些的整数。
3.23和52.3E-4是浮点数的例子。E标记表示10的幂。在这里,52.3E-4表示52.3 * 10-4。
(-5+4j)和(2.3-4.6j)是复数的例子。
int(整型)
在32位机器上,整数的位数为32位,取值范围为-231~231-1,即-2147483648~2147483647
在64位系统上,整数的位数为64位,取值范围为-263~263-1,即-9223372036854775808~9223372036854775807
long(长整型)跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长整数数值不可能无限大。
注意,自从Python2.2起,如果整数发生溢出,Python会自动将整数数据转换为长整数,所以如今在长整数数据后面不加字母L也不会导致严重后果了。
float(浮点型) 浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型,占8个字节(64位),其中52位表示底,11位表示指数,剩下的一位表示符号。
complex(复数)
复数由实数部分和虚数部分组成,一般形式为x+yj,其中的x是复数的实数部分,y是复数的虚数部分,这里的x和y都是实数。
注:Python中存在小数字池:-5 ~ 257
2、布尔值
真或假
1 或 0
3、字符串
"hello world"
万恶的字符串拼接:
python中的字符串在C语言中体现为是一个字符数组,每次创建字符串时候需要在内存中开辟一块连续的空,并且一旦需要修改字符串的话,就需要再次开辟空间,万恶的+号每出现一次就会在内从中重新开辟一块空间。
字符串格式化
PS: 字符串是 %s;整数 %d;浮点数%f
移除空白
分割
长度
索引
切片
4、列表
创建列表:
基本操作:
索引
切片
追加
删除
长度
切片
循环
包含
5、元祖
创建元祖:
基本操作:
索引
切片
循环
长度
包含
6、字典(无序)
创建字典:
常用操作:
索引
新增
删除
键、值、键值对
循环
长度
PS:循环,range,continue 和 break
十一、运算
算数运算:
比较运算:
赋值运算:
逻辑运算:
成员运算:
身份运算:
位运算:
运算符优先级:
更多内容:猛击这里
十二、初识文本的基本操作
打开文件:
file_obj = file("文件路径","模式")
打开文件的模式有:
r,以只读方式打开文件
w,打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a,打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
w+,打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
读取文件的内容:
写文件的内容:
关闭文件句柄: