Python 简单说明与数据结构

Python 作为 “国内” 较流行的高级语言,具有代码容易理解、专注解决问题、混合编译其他语言的优点。


变量

变量是一个最基本的储存单位,它暂时性储存coder放进去的信息。

>>>answer = 42 # 变量名(标识符) 赋值(赋值符) 变量值(值)

注意:Python 对大小写敏感、缩进为四个空格。

>>>print(answer)#将变量名(需打印的对象)放入括号内

注意:Python 中变量、数字不需要括号。字符串需要括号:print(str("内123容")) print(int(123))

>>>num = 123
>>>string = "123"
>>>print(num + string)
TypeError: unsupported operand type(s) for +: 'int' and 'str'
>>>string2 = int(string)
>>>print(num + string2)
246

注意:Python 中只有相同的数据类型才能"+"相加,num(num)转成str(num)则被当作string处理,可以字符串合并(当然俩个 str("string") 本身就可以合并。

BTW:

% 取模 - 除法的余数
** 幕 - x的y次幕 -eq pow(x,y)
// 取整余 - 商的整数部分
字符串
>>>import bs4
>>>import requests
>>>response = requests.get("http://www.irabe.me")
>>>response.encoding = "utf-8"
>>>soup = bs4.BeatifulSoup(response.text,'lxml')
>>>text = soup.select("body > div.rabbit > a")
>>>print(r'''

上面是一段基本完整的 webScraping 代码

'command' -eq '完整的代码集'
"string" -eq "单独的字符串"
\'\'\'string\'\'\' \'\'\'note\'\'\'
'''

注意:r'''string'' 可以无限换行,"\" 是转义符。"/" 是换行符

>>>word = 'friends'
>>>find_the_evil_in_your_friends = word[0]+word[2:4]+word[-3:-1]
>>>fiend

BTW:

:: -eq "friends"
0 -eq "f"
:1 -eq "fr"
-2: -eq "ds" -ne ":-2"
1:2 -eq "ri" -ne "ir"
-1:-3 -eq "nds" -ne "sdb"
函数
)
function(arg1=1,arg2=2)

对应的参数传入方式被称作是“关键词参数”。

function(1,2)

直接的传入参数的方式被称作为“位置参数”。

首先:举个栗子并且列出图表,后有详细。

集合、字典- > {}

列表- > []

元组- > ()

print("{}this is {}".format("Say:","test"))
[::]
.format("Say:","test")

列表 list--------- [word1,word2,word3,etc]

元素可变、位置有序、包容万象

可以索引,可以切片

list.insert(0,"a")、list.append("a")
list.remove("a")、list.pop[0] del list[0]
list[0]=“b”

可查

元组 tuple--------- (url=new,“w”)

除无法修改,其他和列表一致

可以索引,可以切片

字典 dict --------- {first:word1,second:word,etc}

数据键值对出现

键不重复,不可变、值可重复可变

可以索引,不可以切片

dict["New"]="Newsomething"
del dict["New"]

可查

集合 set--------- {word1,word2,word3,etc}

集合元素仅可删减与添加

不可以索引,不可以切片

a={1,2,3,4,5}
a.add("5")
a.discard("5")

一、第一句Python代码

在 /home/dev/ 目录下创建 hello.py 文件,内容如下:

执行 hello.py 文件,即: python /home/dev/hello.py

python内部执行过程如下:


二、解释器

上一步中执行 python /home/dev/hello.py 时,明确的指出 hello.py 脚本由 python 解释器来执行。

如果想要类似于执行shell脚本一样执行python脚本,例: ./hello.py,那么就需要在 hello.py 文件的头部指定解释器,如下:

如此一来,执行: ./hello.py 即可。

ps:执行前需给予 hello.py 执行权限,chmod 755 hello.py

三、内容编码

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。



显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,

注:此处说的的是最少2个字节,可能更多

UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...

所以,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),如果是如下代码的话:

报错:ascii码无法表示中文

改正:应该显示的告诉python解释器,用什么编码来执行源代码,即:

四、注释

当行注视:# 被注释内容

多行注释:""" 被注释内容 """

五、执行脚本传入参数

Python有大量的模块,从而使得开发Python程序非常简洁。类库有包括三中:

Python内部提供的模块

业内开源的模块

程序员自己开发的模块

Python内部提供一个 sys 的模块,其中的 sys.argv 用来捕获执行执行python脚本时传入的参数

六、 pyc 文件

执行Python代码时,如果导入了其他的 .py 文件,那么,执行过程中会自动生成一个与其同名的 .pyc 文件,该文件就是Python解释器编译之后产生的字节码。

ps:代码经过编译可以产生字节码;字节码通过反编译也可以得到代码。

七、变量

1、声明变量

上述代码声明了一个变量,变量名为: name,变量name的值为:"wupeiqi"

变量的作用:昵称,其代指内存里某个地址中保存的内容


变量定义的规则:

变量名只能是 字母、数字或下划线的任意组合

变量名的第一个字符不能是数字

以下关键字不能声明为变量名

['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

2、变量的赋值

[


#!/usr/bin/env python
# -*- coding: utf-8 -*-
name1 = "wupeiqi"
name2 = "alex"

[


[


#!/usr/bin/env python
# -*- coding: utf-8 -*-
name1 = "wupeiqi"
name2 = name1


八、输入

输入密码时,如果想要不可见,需要利用getpass 模块中的 getpass方法,即:

九、流程控制和缩进

需求一、用户登陆验证

需求二、根据用户输入内容输出其权限

外层变量,可以被内层变量使用

内层变量,无法被外层变量使用

十、初识基本数据类型

1、数字

2 是一个整数的例子。

长整数 不过是大一些的整数。

3.23和52.3E-4是浮点数的例子。E标记表示10的幂。在这里,52.3E-4表示52.3 * 10-4。

(-5+4j)和(2.3-4.6j)是复数的例子。

int(整型)

在32位机器上,整数的位数为32位,取值范围为-231~231-1,即-2147483648~2147483647

在64位系统上,整数的位数为64位,取值范围为-263~263-1,即-9223372036854775808~9223372036854775807

long(长整型)跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长整数数值不可能无限大。

注意,自从Python2.2起,如果整数发生溢出,Python会自动将整数数据转换为长整数,所以如今在长整数数据后面不加字母L也不会导致严重后果了。

float(浮点型)  浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型,占8个字节(64位),其中52位表示底,11位表示指数,剩下的一位表示符号。

complex(复数)

复数由实数部分和虚数部分组成,一般形式为x+yj,其中的x是复数的实数部分,y是复数的虚数部分,这里的x和y都是实数。

注:Python中存在小数字池:-5 ~ 257

2、布尔值

真或假

1 或 0

3、字符串

"hello world"

万恶的字符串拼接:

python中的字符串在C语言中体现为是一个字符数组,每次创建字符串时候需要在内存中开辟一块连续的空,并且一旦需要修改字符串的话,就需要再次开辟空间,万恶的+号每出现一次就会在内从中重新开辟一块空间。

字符串格式化

PS: 字符串是 %s;整数 %d;浮点数%f

移除空白

分割

长度

索引

切片

4、列表

创建列表:

基本操作:

索引

切片

追加

删除

长度

切片

循环

包含

5、元祖

创建元祖:

基本操作:

索引

切片

循环

长度

包含

6、字典(无序)

创建字典:

常用操作:

索引

新增

删除

键、值、键值对

循环

长度

PS:循环,range,continue 和 break

十一、运算

算数运算:


比较运算:


赋值运算:


逻辑运算:


成员运算:


身份运算:


位运算:


运算符优先级:


更多内容:猛击这里

十二、初识文本的基本操作

打开文件:

file_obj = file("文件路径","模式")

打开文件的模式有:

r,以只读方式打开文件

w,打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

a,打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

w+,打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

读取文件的内容:

写文件的内容:

关闭文件句柄: