一.今日内容

(一) is,==,id

(二) 代码块的含义

(三) 小数据池

(四) python编码之二

(一)代码块

python程序是有代码块组成的,块是一个python程序的文本,是作为一个单元的执行。

代码块:一个模块,一个函数,一个文件都是一个代码块。但是,在交互环境(终端环境)中,每输入的一个命令,每一行都是一个代码块。

python可以用什么写 python用什么写程序块_字符串

而且在一个文件中的两个函数,也分别是不同的代码块:

python可以用什么写 python用什么写程序块_python可以用什么写_02

(二) ==,id(),is

‘==’:用于判断两个对象的内容是否相等

#一个“ = ” 表示赋值表达式
name = 'he'
#“==” 表示数值内容的相同
print('he' == 'he')
>>> True
name = 'he'
name1 = 'alex'
print(name == name1)
>>>False

id() : 返回对象在内存当中的内存地址

1.在内存中,id都是唯一的

2.如果两个变量指向的值的id相同,就证明他们在内存中是同一个。

name = 'he'
name1 = 'he'
print(id(name))
>>> 2101255303664
print(id(name1))
>>>2101255303664

is : 判断两个值是否id(内存地址)相同

name = 'he'
name1 = 'he'
print(name1 is name)
>>>
True

# 结论:如果is为True,说明内存地址相同,那么值一定相同;如果值相同,内存地址未必相同。

(三)小数据池(缓存机制,驻留机制)

小数据池:又称为小整数缓存机制,驻留机制。

小数据池的前提:小数据池的数据类型只针对“整数,字符串,bool值”

概念:

小数据池是Python对内存做的一个优化,将-5~256的整数,以及一定规则的字符串,提前在内存中创建

了池,池里固定的放了这些数据。

优点:1. 节省内存

2. 提高性能和效率

int : -5~256的整数,如果多个变量同时指向这个范围内的整数,那么它们在内存中将指向同一个内存地址。

python可以用什么写 python用什么写程序块_python可以用什么写_03

str:什么才是一定规则的字符串呢??

(1)当字符串的长度为0或者1时,默认采用小数据池驻留机制。

python可以用什么写 python用什么写程序块_ico_04

(2)当字符串的长度大于1时,如果只由英文字母,数字,下划线组成,默认采用小数据池驻留机制。

python可以用什么写 python用什么写程序块_python可以用什么写_05

(3)用“*”得到的字符串,可以分为两种情况:

3.1 乘数为1,默认驻留

python可以用什么写 python用什么写程序块_字符串_06

3.2 乘数为2,但字符串总长度小于20时,默认驻留

python可以用什么写 python用什么写程序块_ico_07

bool类型:bool值就是True,False,无论你创建多少个变量指向True,False,那么他在内存中只存在一个。

### 代码块与小数据池之间的关系 ####
# pycharm 通过运行文件的方式执行下列代码:
i1 = 1000
i2 = 1000
print(i1 is i2) # 结果为True

通过交互方式中执行下面代码:

>>> i1 = 1000
>>> i2 = 1000
>>> print(i1 is i2)
False

为什么在pycharm与交互环境中,输出的结果会不同呢???这就牵涉到了代码块与小数据池之间的关系。

Python在同一个代码块中,初始化对象时,会把变量以及对应的值放置到内存的一个字典中(类似:dic={'name' ='he'对应的内存地址}),如果下面代码再遇到对象的初始化赋值时,如果有相同的值,会去字典中寻找,然后直接复用,指向同一个内存地址。

Python在不同代码块中,初始化对象时,会遵循小数据池的原则。

参考上面关于代码块的概念,因为pycharm中一个py文件为一个代码块,而在交互文件中,不同的两行为不同的代码块,所以会出现上面的差异。

(四)python编码之二

编码之初的内容,看回之前的博客内容。

###########################################################################################

从之前的内容,我们可以得出以下结论:

(1)编码之间是不能相互识别的。

(2)因为unicode太过于浪费资源,所以在网络传输,本地存储,都必须不能够以unicode作为编码格式。

###########################################################################################

前提须知:

在python3.x版本中,字符串的编码为unicode,其他均为utf-8.

但是这样又存在了问题,那么字符串作为网络传输,本地存储的数据类型,编码类型为unicode,是不允许的。。那要怎么办?

于是此时,引出了有一个python中的基本数据类型bytes。bytes类型好比与str类型的双胞胎兄弟,str类型所有的方法,bytes类型都可以使用。

### bytes类型与str类型的区别?###

对于英文:

str:

表现形式: s1 = 'hehehe'

编码类型: unicode

bytes:

表现形式: b1 = b'hehehe'

编码类型: 非unicode

对于中文:

str:

表现形式: s1 = '呵呵呵'

编码类型: unicode

bytes:

表现形式: b1 = b'\xe5\x91\xb5\xe5\x91\xb5\xe5\x91\xb5'

表现类型:非unicode

结论:

#为什么需要同时拥有str与bytes?

因为中文在bytes中的显示方式是16进制,不便于阅读。所以需要同时存在str与bytes

#str类型和bytes类型如何使用?

在本地存储/网络socekt传输时,用bytes类型,因为字符串编码为unicode。其他用str类型

### bytes类型与str类型的转换?###
'''str与bytes的转换'''
str ----> bytes encode()编码
s1 = 'alex'
b1 = s1.encode('utf-8')
print(b1,type(b1))
#bytes ---->str decode()解码
b1 = b'\xe5\x91\xb5\xe5\x91\xb5\xe5\x91\xb5'
s1 = b1.decode('utf-8')
print(s1)
>>> 呵呵呵