一、数字 整型与浮点型
#整型int
作用:年纪,等级,×××号,qq号等整型数字相关
定义:
age=10 #本质age=int(10)
#浮点型float
作用:薪资,身高,体重,体质参数等浮点数相关
salary=3000.3 #本质salary=float(3000.3)
#二进制,十进制,八进制,十六进制
其他数字类型
#长×××(了解)
在python2中(python3中没有长×××的概念):
>>> num=2L
>>> type(num)
<type 'long'>
#复数(了解)
>>> x=1-2j
>>> x.real
1.0
>>> x.imag
-2.0
二、字符串
#作用:名字,性别,国籍,地址等描述信息
#定义:在单引号\双引号\三引号内,由一串字符组成
name='hgz'
#优先掌握的操作:
#1、按索引取值(正向取+反向取) :只能取
#2、切片(顾头不顾尾,步长)
#3、长度len
#4、成员运算in和not in
#5、移除空白strip
#6、切分split
#7、循环
需要掌握的操作
#1、strip,lstrip,rstrip
>>> name = " hgz "
>>> name.strip()
'hgz'
>>> name.lstrip()
'hgz '
>>> name.rstrip()
' hgz'
#2、lower,upper
# lower就是把所有的大写字符串变小写 ,upper 就是把所有的小写变大些;
>>> name = "Hgz"
>>> name.lower()
'hgz'
>>> name = "HgZ"
>>> name.lower()
'hgz'
>>> name = "Hgz"
>>> name.upper()
'HGZ'
>>> name = "HgZ"
>>> name.upper()
'HGZ'
#3、startswith,endswith ##就是判断以什么开头,或者什么结尾的;
>>> name = "Hgz"
>>> name.startswith('H')
True
>>> name.endswith('Z')
True
>>> name.endswith('z')
False
#4、format的三种玩法
#第一种:是按照从左到右的顺序插入
>>> res='{} {} {}'.format('hgz',18,'male')
>>> res
'hgz 18 male'
#第二种:通过index下标指定插入的key值
>>> res='{1} {0} {1}'.format('hgz',18,'male')
>>> res
'18 hgz 18'
# 第三种:通过key=value的方式执行插入的值
>>> res='{name} {age} {sex}'.format(sex='male',name='hgz',age=18)
>>> res
'hgz 18 male'
#5、split,rsplit 默认分隔符为空格
# split切割,切割后以列表的方式展示
>>> name='root:x:0:0::/root:/bin/bash'
>>> name.split(':')
['root', 'x', '0', '0', '', '/root', '/bin/bash']
>>> name='C:/a/b/c/d.txt'
>>> name.split('/',1)
['C:', 'a/b/c/d.txt']
# rsplit 从右边开始切分
>>> name='C:/a/b/c/d.txt'
>>> name.rsplit('/',1)
['C:/a/b/c', 'd.txt']
#6、join
# 可迭代对象必须都是字符串
>>> tag = ''
>>> tag.join(['hzg','say','hello','world'])
'hzgsayhelloworld'
>>> tag = ' '
>>> tag.join(['hzg','say','hello','world'])
'hzg say hello world'
#7、replace
# 替换
>>> name='alex say :i have one tesla,my name is alex'
>>> print(name.replace('alex','SB',1))
SB say :i have one tesla,my name is alex
>>>
>>> print(name.replace('alex','SB'))
SB say :i have one tesla,my name is SB
#8、isdigit
#可以判断bytes和unicode类型,是最常用的用于于判断字符是否为"数字"的方法
>>> age = '18'
>>> age.isdigit()
True
>>> age = 'male'
>>> age.isdigit()
False
其它一些操作
#1、find,rfind,index,rindex,count
#2、center,ljust,rjust,zfill
#3、expandtabs
#4、captalize,swapcase,title
#5、is数字系列
#6、is其他
#find,rfind,index,rindex,count
name='hgz say hello'
print(name.find('o',1,3)) #顾头不顾尾,找不到则返回-1不会报错,找到了则显示索引
# print(name.index('e',2,4)) #同上,但是找不到会报错
print(name.count('e',1,3)) #顾头不顾尾,如果不指定范围则查找所有
#center,ljust,rjust,zfill
name='hgz'
print(name.center(30,'-'))
print(name.ljust(30,'*'))
print(name.rjust(30,'*'))
print(name.zfill(50)) #用0填充
#expandtabs
name='egon\thello'
print(name)
print(name.expandtabs(1))
#captalize,swapcase,title
print(name.capitalize()) #首字母大写
print(name.swapcase()) #大小写翻转
msg='egon say hi'
print(msg.title()) #每个单词的首字母大写
#is数字系列
#在python3中
num1=b'4' #bytes
num2=u'4' #unicode,python3中无需加u就是unicode
num3='四' #中文数字
num4='Ⅳ' #罗马数字
#isdigt:bytes,unicode
print(num1.isdigit()) #True
print(num2.isdigit()) #True
print(num3.isdigit()) #False
print(num4.isdigit()) #False
#isdecimal:uncicode
#bytes类型无isdecimal方法
print(num2.isdecimal()) #True
print(num3.isdecimal()) #False
print(num4.isdecimal()) #False
#isnumberic:unicode,中文数字,罗马数字
#bytes类型无isnumberic方法
print(num2.isnumeric()) #True
print(num3.isnumeric()) #True
print(num4.isnumeric()) #True
#三者不能判断浮点数
num5='4.3'
print(num5.isdigit())
print(num5.isdecimal())
print(num5.isnumeric())
'''
总结:
最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景
如果要判断中文数字或罗马数字,则需要用到isnumeric
'''
#is其他
print('===>')
name='hgz123'
print(name.isalnum()) #字符串由字母或数字组成
print(name.isalpha()) #字符串只由字母组成
print(name.isidentifier())
print(name.islower())
print(name.isupper())
print(name.isspace())
print(name.istitle())
示例
三、列表
#作用:多个装备,多个爱好,多门课程,多个女朋友等
#定义:[]内可以有多个任意类型的值,逗号分隔
my_friends=['hgz','hgz1','hgz2',4,5] #本质my_friends=list([...])或l=list('abc')
#优先掌握的操作:
#1、按索引存取值(正向存取+反向存取):即可存也可以取
#2、切片(顾头不顾尾,步长)
#3、长度
#4、成员运算in和not in
#5、追加
#6、删除
#7、循环
#ps:反向步长
l=[1,2,3,4,5,6]
#正向步长
l[0:3:1] #[1, 2, 3]
#反向步长
l[2::-1] #[3, 2, 1]
#列表翻转
l[::-1] #[6, 5, 4, 3, 2, 1]
四、元组
#作用:存多个值,对比列表来说,元组不可变(是可以当做字典的key的),主要是用来读
#定义:与列表类型比,只不过[]换成()
age=(11,22,33,44,55) 本质age=tuple((11,22,33,44,55))
#优先掌握的操作:
#1、按索引取值(正向取+反向取):只能取
#2、切片(顾头不顾尾,步长)
# age=(11,22,33,44,55)
# print(age[0:3])
# print(age)
#3、长度
# age=(11,22,33,44,55)
# print(len(age))
#4、成员运算in和not in
# age=(11,22,33,44,55)
# print(11 in age)
#5、循环
# for item in age:
# print(item)
#二:该类型总结
# 1 存一个值or存多个值
# 可以存多个值,值都可以是任意类型
# 2 有序
# 3 可变or不可变
# 不可变:值变,id就变。不可变==可hash
五、字典
#作用:存多个值,key-value存取,取值速度快
#定义:key必须是不可变类型,value可以是任意类型
info={'name':'egon','age':18,'sex':'male'} #本质info=dict({....})
或
info=dict(name='hgz',age=18,sex='male')
或
info=dict([['name','hgz'],('age',18)])
或
{}.fromkeys(('name','age','sex'),None)
#优先掌握的操作:
#1、按key存取值:可存可取
#2、长度len
#3、成员运算in和not in
#4、删除
#5、键keys(),值values(),键值对items()
#6、循环
六、集合
#作用:去重,关系运算,
#定义:
知识点回顾
可变类型是不可hash类型
不可变类型是可hash类型
#定义集合:
集合:可以包含多个元素,用逗号分割,
集合的元素遵循三个原则:
1:每个元素必须是不可变类型(可hash,可作为字典的key)
2:没有重复的元素
3:无序
注意集合的目的是将不同的值存放到一起,不同的集合间用来做关系运算,无需纠结于集合中单个值
#优先掌握的操作:
#1、长度len
#2、成员运算in和not in
#3、|合集
#4、&交集
#5、-差集
#6、^对称差集
#7、==
#8、父集:>,>=
#9、子集:<,<=
一.关系运算
有如下两个集合,readbooks是喜欢readbooks的人的名字集合,play是喜欢play课程玩的人的名字集合
readbooks={'hgz','hgz1','hgz2','hgz3','hgz4','hgz5'}
play={'hgz5','hgz6','hgz7'}
1. 求出即报名python又报名linux课程的学员名字集合
2. 求出所有报名的学生名字集合
3. 求出只报名python课程的学员名字
4. 求出没有同时这两门课程的学员名字集合
# 1. 合集 | :喜欢玩和读的所有人
# print(readbooks | play)
# print(readbooks.union(play))
# 2、&交集:同时喜欢玩和读书的人
# print(readbooks & play)
# print(readbooks.intersection(play))
# 3、^对称差集:没有共同爱好的人
# print(readbooks ^ play)
# print(readbooks.symmetric_difference(play))
# 4 -差集:只喜欢读书的人
# print(readbooks - play)
# print(readbooks.difference(play))
# -差集:只喜欢玩的人
# print(play - readbooks)
# 5 父集:>,>=,子集:<,<=
# s1={1,2,3}
# s2={1,2,}
# print(s1 >= s2)
# print(s1.issuperset(s2))
# print(s2.issubset(s1))
二.去重
1. 有列表l=['a','b',1,'a','a'],列表元素均为可hash类型,去重,得到新列表,且新列表无需保持列表原来的顺序
#去重,无需保持原来的顺序
l=['a','b',1,'a','a']
print(set(l))
2.在上题的基础上,保存列表原来的顺序
#去重,并保持原来的顺序
#方法一:不用集合
l=[1,'a','b',1,'a']
l1=[]
for i in l:
if i not in l1:
l1.append(i)
print(l1)
#方法二:借助集合
l1=[]
s=set()
for i in l:
if i not in s:
s.add(i)
l1.append(i)
print(l1)
3.去除文件中重复的行,肯定要保持文件内容的顺序不变
#同上方法二,去除文件中重复的行
import os
with open('db.txt','r',encoding='utf-8') as read_f,\
open('.db.txt.swap','w',encoding='utf-8') as write_f:
s=set()
for line in read_f:
if line not in s:
s.add(line)
write_f.write(line)
os.remove('db.txt')
os.rename('.db.txt.swap','db.txt')
#列表中元素为可变类型时,去重,并且保持原来顺序
l=[
{'name':'egon','age':18,'sex':'male'},
{'name':'alex','age':73,'sex':'male'},
{'name':'egon','age':20,'sex':'female'},
{'name':'egon','age':18,'sex':'male'},
{'name':'egon','age':18,'sex':'male'},
]
# print(set(l)) #报错:unhashable type: 'dict'
s=set()
l1=[]
for item in l:
val=(item['name'],item['age'],item['sex'])
if val not in s:
s.add(val)
l1.append(item)
print(l1)
4.有如下列表,列表元素为不可hash类型,去重,得到新列表,且新列表一定要保持列表原来的顺序
#定义函数,既可以针对可以hash类型又可以针对不可hash类型
def func(items,key=None):
s=set()
for item in items:
val=item if key is None else key(item)
if val not in s:
s.add(val)
yield item
print(list(func(l,key=lambda dic:(dic['name'],dic['age'],dic['sex']))))