集合是一个无序的,不重复的数据组合,它有着两个主要作用:去重以及关系测试。去重指的是当把一个列表变成了集合,其中重复的内容就自动的被去掉了
关系测试指的是,测试两组数据之间的交集、差集、并集等关系。
去重测试代码如下:
# 创建一个列表 -- 里面存在一些重复值
test_list = [1,2,3,4,2,2,3,4,3,2,3,4]
# 利用集合将列表中重复的内容去掉
test_list = set(test_list)
# 打印测试并且查看test_list 被赋予新值后的数据类型print(test_list,type(test_list)) # {1, 2, 3, 4}
Tip:需要注意的是,集合和字典一样都是无序的。
获取交集需要使用集合中的方法intersection方法,获取两个集合中的交集代码如下:
# 创建两个集合,并且获取集合的交集
test_list_01 = set([\'YanYan\',\'LiBai\',\'LuLu\',\'YangMi\'])
test_list_02 = set([\'YanYan\',\'LiuDeHua\',\'ZhangXueYou\',\'LiBai\'])
# 在上面的两个集合中,存在相同的值,那么现在我们取出两个集合中的交集
test_intersection = test_list_01.intersection(test_list_02)print(test_intersection) # {\'YanYan\', \'LiBai\'}
获取并集的方式需要采用集合中union方法,获取两个集合的并集代码如下:
# 创建两个集合,并且获取集合的交集
test_list_01 = set([\'YanYan\',\'LiBai\',\'LuLu\',\'YangMi\'])
test_list_02 = set([\'YanYan\',\'LiuDeHua\',\'ZhangXueYou\',\'LiBai\'])
# 采用集合中的union方法获取并集
test_list_union = test_list_01.union(test_list_02)
print(test_list_union) # {\'LiBai\', \'LuLu\', \'ZhangXueYou\', \'LiuDeHua\', \'YangMi\', \'YanYan\'}
获取差集的方式要采用集合中的difference方法,获取两个集合的差集的代码如下所示:
# 创建两个集合,并且获取集合的交集
test_list_01 = set([\'YanYan\',\'LiBai\',\'LuLu\',\'YangMi\'])
test_list_02 = set([\'YanYan\',\'LiuDeHua\',\'ZhangXueYou\',\'LiBai\'])
# 使用集合中的difference 方法来获取差集
test_difference = test_list_01.difference(test_list_02)
test_difference2 = test_list_02.difference(test_list_01)
print(test_difference) # {\'LuLu\', \'YangMi\'}print(test_difference2) # {\'ZhangXueYou\', \'LiuDeHua\'}
判断一个集合是否是另外一个集合的子集可以使用issubset()方法,同样,还可以使用issuperset()方法判断一个集合是否是另外一个集合的父级
代码如下:
# 创建两个集合
list_set = set([1,2,3,4])
list_son = set([2,3])
# 判断list_son是否是list_set的子集print(list_son.issubset(list_set)) # True# 判断list_set 是否是list_son的父级print(list_set.issuperset(list_son)) # True
对称差集(又有人称之为叫做反向差集),指的是取出两个集合中互相都没有的值取出放在一个集合中。
代码如下:
# 创建两个集合
list_set_num1 = set([1,3,5,7,9])
list_set_num2 = set([2,3,4,6,9,10])
# 获取两个集合的对称差集print(list_set_num1.symmetric_difference(list_set_num2)) # {1, 2, 4, 5, 6, 7, 10}
如果上述的难以理解的话,可以对 对称差集理解为去掉两个集合中都存在的内容,将剩余的内容取到一个新的集合中。
除了上述的这些方法实现的关系功能之外,还有一个方法 isdisjoint() ,功能是判断两个集合中是否有相同的值,如果两个集合中没有相同的值(即没有交集),那么返回True
代码如下:
# 创建集合
test_set_num1 = set([1,2,3,4])
test_set_num2 = set([5,6,7,8])
test_set_num3 = set([1,3,7,8])
# 使用isdisjoint()方法来判断print(test_set_num1.isdisjoint(test_set_num2)) # Trueprint(test_set_num1.isdisjoint(test_set_num3)) # False
通过运算符来进行关系测试
在上面的应用中,主要是通过python中的方法进行的关系测试,那么在python中,除了使用方法以外,还可以使用关系运算符来进行关系测试。
实例代码如下:
test_list_01 = set([\'YanYan\',\'LiBai\',\'LuLu\',\'YangMi\'])
test_list_02 = set([\'YanYan\',\'LiuDeHua\',\'ZhangXueYou\',\'LiBai\'])
# 获取交集 &print(test_list_01 & test_list_02) # {\'LiBai\', \'YanYan\'}
# 获取并集 |print(test_list_01 | test_list_02) # {\'LuLu\', \'LiBai\', \'LiuDeHua\', \'YanYan\', \'ZhangXueYou\', \'YangMi\'}
# 获取差集 -print(test_list_01 - test_list_02) # {\'LuLu\', \'YangMi\'}print(test_list_02 - test_list_01) # {\'LiuDeHua\', \'ZhangXueYou\'}
# 获取对称差集print(test_list_01 ^ test_list_02) # {\'ZhangXueYou\', \'YangMi\', \'LuLu\', \'LiuDeHua\'}
集合的增删改查
添加
语法: Set.add()
代码如下:
# 创建一个集合
test_set = set([\'YanYan\'])
# 添加
test_set.add(\'LiBai\') # 添加一项
test_set.update([\'LuLu\',\'JingJing\']) # 一次性向集合中添加多项
# 输出集合
print(test_set) # {\'YanYan\', \'LuLu\', \'LiBai\', \'JingJing\'}
删除
删除集合中的某一个元素可以使用remove方法
代码如下:
# 创建一个集合
test_set = set([\'YanYan\'])
# 使用remove方法删除元素
test_set.remove(\'YanYan\')print(test_set) # set()
删除项目除了使用remove以外,还可以使用pop()方法,但是pop()方法删除内容不能够指定,只是随机删除。
pop方法会把删除的内容返回,示例代码如下:
# 创建一个集合
test_set = set([20,9,\'a\',1,2,3,4])print(test_set.pop()) # 1print(test_set.pop()) # 2print(test_set.pop()) # 3
删除元素还可以使用discard()方法,这个方法没有返回值,如果打印返回值的话会输出None
# 创建一个集合
test_list = set([1,2,3,4,5])
# 使用discard()方法删除 -- 注意,discard()方法删除返回None,也就是没有返回值print(test_list.discard(3)) # None# 此时原集合中的3已经被删除了print(test_list) # {1, 2, 4, 5}
查询
x in s # 判断 x是否是s 的成员
x not in s 判断x 是否是s的成员
len(x) # 查看x的长度
s <= t # 测试是否s中的每一个元素都在t中
s >= t # 测试是否 t 中的每一个元素都在 s 中