类似于其他语言,Python也将需要表示和操作的数据划分成不同的数据类型。python中的每个数据值都被称为一个对象(object),并且这个对象有三个属性值(唯一标识、数据类型、值),分别对应计算机内存地址、数据类别、数据值。
python数据类型分类如下:
数字类型与其他编程语言类似,这里不再具体讲解。作为Python中最重要的基础知识,下面主要梳理下字符串、列表、元组、字典、集合的核心知识点。
首先明确几个概念
序列:有固定顺序排列的数据。
不可变类型:如果变量名引用的内存空间的值不能够修改,数字、字符串、布尔值、元组属于不可变类型。
可变类型:变量名引用的内存空间的值能够修改,可以向容器中增删对象,将容器中的某个元素的索引赋给一个新的对象。列表(List)、字典(Dictionary)、集合属于可变类型。
索引
索引可以理解为元素的下标,我们可以通过索引(index)来获取序列中的元素。序列中每个元素都有一个位置,按照顺序进行标记,索引是从0开始的整数,第一个位置索引为0,第二个位置索引为1,以此类推。
索引的用法:使用 序列名[索引值]
切片
切片操作(slice)可以从一个字符串中获取子字符串(字符串的一部分)。我们使用一对方括号、起始偏移量start、终止偏移量end 以及可选的步长step 来定义一个分片。切片使用 索引值 来限定范围,从一个大的序列 中切出小的序列。
使用方法: 字符串[开始索引:结束索引:步长]
注意:
- 开始索引、 结束索引指定的区间属于左闭右开型 [开始索引, 结束索引),所以不包含索引结束元素。
- 如果索引从0开始,开始索引数字可以省略,但冒号不能省略。到末尾结束,结束索引数字可以省略,冒号不能省略
常用的索引实例:
str='testers'
连续式数据
元素是连续存放的,除了第一个前面没有元素,最后一个后面没有元素。支持索引访问和切片操作。包括:字符串、列表、元组
非连续式数据
元素不是连续存放的,任意元素的前后都有可能没有元素,不支持索引和切片操作。包括:字典、集合
1.字符串
概念:字符串是一个有序的字符集合在 Python 中可以使用一对单引号、双引号、三引号 定义一个字符串。
创建:
- s1='hellotesters'
- s2="hello world!"
操作:
print(s1[0])#字符串索引
print(s1[0:5])#字符串切片
print(s1*3)#字符串复制
print(s1+s2)#字符串拼接
print(len(s1))#输出字符串长度
#s1.strip()#截掉字符串两侧指定的字符
print(s1.split('o'))#以字母切割字符串,o被切走
print(s1.replace('testers','world'))#将s1中的testers替换为world
2.列表list
概念:存储多个有序任意类型的数据,属于可变类型。
列表用[]表示。
list= ['a','b','c','d']
列表的创建
- list1 = []#创建一个空列表`
- list2 = ['a','b','c','d']#按顺序存储4个值的列表`
- list3 = [10,'hello',True,[1,2,3]]#列表中可以存储任意类型的数据
访问列表对象
- list[0]#索引
- list[0:2]#切片
常见操作
list.remove('hello')#删除指定元素
list.reverse()#反转列表
list.pop()#根据索引删除并返回被删除的元素
list.append()# 向列表的最后添加一个元素
list.insert()# 向列表的指定位置插入一个元素
list.clear()# 清空序列
list.sort()#升序
list.sort(reverse=True)#降序
3.元组tuple
概念:类似于列表,但是元组是不可变类型的,创建元组后,无法修改元组的值,无法添加或修改元素。
使用()来创建元组
- tuple1 = () # 创建了一个空元组,如果元组不是空元组,它里边至少要有一个,
- tuple2 = (1, 2, 3, 4, 5) # 创建了一个5个元素的元组
访问元组对象
- tuple2[0]#索引
- tuple2[0:2]#切片
元组的使用场景:元组不可修改,保证了程序不会对数据进行意外修改,保证了数据的完整性和安全性。它的操作的方式基本上和列表是一致的,所以你在操作元组时,就把元组当成是一个不可变的列表。4.字典字典是一种key-value键值对形式的数据类型,将一个key对象链接到一个value对象,可以通过键在字典中查询。使用 {} 来创建字典语法:{key1:value1,key2:value2,key3:value3}说明:
- 字典使用键值对存储数据,键值对之间使用 逗号分隔,每个键值对用冒号分隔。
- 键必须是唯一的(字符串、数字、元组)
- 值可以去任意类型数据。
- d = {'name':'张三', 'age':18, 'gender':'男'}
常用操作:
print(d['name']) #根据key获取value
d['name'] = '李四'# 修改字典值
d['address'] = '高新路'# 向字典中添加key-value
del d['a'] # 删除
d.clear()#清空字典
d.values()#所有value列表
d.keys()#所有key列表
d.items()#返回字典中所有的项,(key,value)元组列表
5.集合
集合是一个无序的,不重复的数据组合。可以实现数据的去重以及两组数据交集、差集、并集等操作。
使用 {} 来创建集合
集合的三个原则:
- 每个元素必须是不可变类型(可作为字典的key)
- 没有重复的元素
- 无序
- s = {10,3,5,1,2,1,2,3,1,1,1,1} #创建集合
- s = {[1,2,3],[4,6,7]}#创建集合
- s.add()# 向集合中添加元素