1.集合set的定义
集合是不重复的数据结构
【1】方法一:s={1,2,3,2,3}
【2】方法二:工厂方法定义集合时,括号里面是可迭代的对象, eg:数值类型不可以;
S=set();s=set([1,2,3,1,2,3]);s=set(“hello”);s=set((1,2,3,1,2,3));s=set({‘a’:1,’b’:2})
注:集合会自动去重。
应用: 如何实现列表去重?
【1】转换为集合数据类型; set(列表)
a=[1,2,3,2,1]
>>> c=set(a)
>>> print(c)
{1, 2, 3}【2】字典的fromkeys方法实现;
PyDev console: starting.
Python 3.8.2 (tags/v3.8.2:7b3ab59, Feb 25 2020, 22:45:29) [MSC v.1916 32 bit (Intel)] on win32
>>> a=[1,2,3,2,1]
>>> b={}.fromkeys(a)
>>> b.keys()
dict_keys([1, 2, 3])2.集合的特性
【1】集合是无序的,不重复的数据类型;
【2】不支持索引,也不支持切片;
【3】也不支持重复,也不支持连接;
【4】支持成员操作符;
【5】支持for循环;
3.集合的增删改查
【1】增
第一种方式,我们可以通过集合的add方法添加元素:
>>> a={1,2,3}
>>> a.add("a","b","c")
Traceback (most recent call last):
File "<input>", line 1, in <module>
TypeError: add() takes exactly one argument (3 given)
>>> a.add("a")
>>> print(a)
{1, 2, 3, 'a'}注意:从上例的报错可以看出,add一次只能添加一个元素。
第二种方式,我们可以只用update添加元素:
>>> a={1,2,3}
>>> b={"a","b","c"}
>>> a.update(b)
>>> print(a)
{1, 2, 3, 'a', 'c', 'b'}【2】删
集合有四种删除元素的方式
- s.pop() s.pop()会随机删除集合的一个元素。
- s.remove(‘a’) s.remove删除集合指定元素,如果不存在,则报错;
- s.discard("a") s.discard删除集合指定元素,如果不存在,do nothing;
- s.clear() s.clear清空集合元素。
【3】改
因为集合是无序的,因此修改可以通过,删除旧的元素,然后再新增新的元素实现。
【4】查
判断元素是否在集合中存在:
>>> a={1,2,3}
>>> 10 in a
False
>>> 1 in a
True【5】列表的集合关系
- 交集 s1 & s2; print s1.intersection(s2);s1.intersection_update(s2)
- 并集s1 | s2; s1.union(s2)
- 差集s1 - s2; s1.difference(s2)
- 对等差分s1 ^ s2; s1.symmetric_difference(s2)
4. 集合的两个功能:
- 集合可以实现去重的功能;
- 集合可以实现关系测试; 交集,差集,并集,是否子集,是否没有交集........
5. 举例
举个例子:
现在IPV4下用一个32位无符号整数来表示,一般用点分方式来显示,点将IP地址分成4个部分,每个部分为8位,表示成一个无符号整数(因此不需要用正号出现),如10.137.17.1,
是我们非常熟悉的IP地址,一个IP地址串中没有空格出现(因为要表示成一个32数字)。
输入描述:输入一个ip地址
输出描述:返回判断的结果YES or NO
#!/usr/bin/env python
#coding:utf-8
#_____________________ _____________________
#_____________________ README _____________________
# Author :WANG *
# Version :1.0 *
# Create_date :2018-01-10 *
# Description : *
# *
#______________________ _______________________
#______________________ END _______________________
def judge(ip):
"""
**************************************************************
IP地址合法性判断
**************************************************************
"""
ip_split = ip.split(".") #将IP分片
if len(ip_split) != 4:
return False
else:
for i in ip_split:
if not (255 > int(i) > 0): #每位数<255
return False
return True
def main():
while True:
ip = input("输入:")
if judge(ip):
print("YES")
else:
print("NO")
if input("是否继续(y/n)?")== 'n':
break
if __name__ == "__main__":
main()Output:
$ python main.py
输入:172.20.25.123
YES
是否继续(y/n)?y
输入:123
NO
是否继续(y/n)?n第二个例子:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000), N是用户输入的,对于 其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应 着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺 序去找同学做调查。请你协助明明完成“去重”与“排序”的工作;
#!/usr/bin/env python
#coding:utf-8
#_____________________ _____________________
#_____________________ README _____________________
# Author :WANG *
# Version :1.0 *
# Create_date :2018-01-11 *
# Description : *
# *
#______________________ _______________________
#______________________ END _______________________
import random
print("""
**************************************************************
华为机试题
**************************************************************
""")
s = set()
N = input('输入一个数:')
for i in range(int(N)):
s.add(random.randint(1, 1000))
print(sorted(s))Output:
$ python main.py
**************************************************************
华为机试题
**************************************************************
输入一个数:20
[2, 65, 70, 77, 136, 147, 160, 236, 317, 319, 335, 358, 491, 536, 550, 641, 759, 829, 848, 889]6.总结
【1】可变数据类型:列表, 字典, 集合
【2】不可变数据类型:数值类型, 字符串, 元组
注:可变数据类型实现某个功能,直接改变可变的数据类型;
注:不可变数据类型实现某个功能,需要将结果赋值给另外一个变量;
【3】是否实现for循环
可迭代数据类型: str, list, tuple, dict, set
不可迭代数据类型:数值类型
【4】是否支持索引,切片,重复和连接特性
有序的数据类型: str, list, tuple
无序的数据类型: dict, set
















