python数据类型

原创

feng945869004 2017-12-14 16:22:38 博主文章分类：python ©著作权

©著作权归作者所有：来自51CTO博客作者feng945869004的原创作品，请联系作者获取转载授权，否则将追究法律责任

一、数字整型与浮点型

#整型int
　　作用：年纪，等级，×××号，qq号等整型数字相关
　　定义：
　　　　age=10 #本质age=int(10)

#浮点型float
　作用：薪资，身高，体重，体质参数等浮点数相关
    salary=3000.3 #本质salary=float(3000.3)
#二进制，十进制，八进制，十六进制

其他数字类型

#长×××（了解）
    在python2中（python3中没有长×××的概念）：　　　　　　
    >>> num=2L
    >>> type(num)
    <type 'long'>

#复数（了解）　　
    >>> x=1-2j
    >>> x.real
    1.0
    >>> x.imag
    -2.0

二、字符串

#作用：名字，性别，国籍，地址等描述信息
#定义：在单引号\双引号\三引号内，由一串字符组成
name='hgz'

#优先掌握的操作：
#1、按索引取值(正向取+反向取) ：只能取
#2、切片(顾头不顾尾，步长)
#3、长度len
#4、成员运算in和not in
#5、移除空白strip
#6、切分split
#7、循环

需要掌握的操作

#1、strip,lstrip,rstrip
>>> name = "   hgz    "
>>> name.strip()
'hgz'
>>> name.lstrip()
'hgz    '
>>> name.rstrip()
'   hgz'

#2、lower,upper
# lower就是把所有的大写字符串变小写 ，upper 就是把所有的小写变大些；
>>> name = "Hgz"
>>> name.lower()
'hgz'
>>> name = "HgZ"
>>> name.lower()
'hgz'

>>> name = "Hgz"
>>> name.upper()
'HGZ'
>>> name = "HgZ"
>>> name.upper()
'HGZ'

#3、startswith,endswith  ##就是判断以什么开头，或者什么结尾的；
>>> name = "Hgz"
>>> name.startswith('H')
True
>>> name.endswith('Z')
True
>>> name.endswith('z')
False

#4、format的三种玩法

#第一种：是按照从左到右的顺序插入
>>> res='{} {} {}'.format('hgz',18,'male')
>>> res
'hgz 18 male'

#第二种：通过index下标指定插入的key值
>>> res='{1} {0} {1}'.format('hgz',18,'male')
>>> res
'18 hgz 18'

# 第三种：通过key=value的方式执行插入的值
>>> res='{name} {age} {sex}'.format(sex='male',name='hgz',age=18)
>>> res
'hgz 18 male'

#5、split,rsplit    默认分隔符为空格
# split切割，切割后以列表的方式展示
>>> name='root:x:0:0::/root:/bin/bash'
>>> name.split(':')
['root', 'x', '0', '0', '', '/root', '/bin/bash']
>>> name='C:/a/b/c/d.txt'
>>> name.split('/',1)
['C:', 'a/b/c/d.txt']

# rsplit 从右边开始切分
>>> name='C:/a/b/c/d.txt'
>>> name.rsplit('/',1)
['C:/a/b/c', 'd.txt']

#6、join   
# 可迭代对象必须都是字符串
>>> tag = ''
>>> tag.join(['hzg','say','hello','world'])
'hzgsayhelloworld'
>>> tag = ' '
>>> tag.join(['hzg','say','hello','world'])
'hzg say hello world'


#7、replace
# 替换
>>> name='alex say :i have one tesla,my name is alex'
>>> print(name.replace('alex','SB',1))
SB say :i have one tesla,my name is alex
>>>
>>> print(name.replace('alex','SB'))
SB say :i have one tesla,my name is SB

#8、isdigit
#可以判断bytes和unicode类型,是最常用的用于于判断字符是否为"数字"的方法
>>> age = '18'
>>> age.isdigit()
True
>>> age = 'male'
>>> age.isdigit()
False

其它一些操作

#1、find,rfind,index,rindex,count
#2、center,ljust,rjust,zfill
#3、expandtabs
#4、captalize,swapcase,title
#5、is数字系列
#6、is其他

#find,rfind,index,rindex,count
name='hgz say hello'
print(name.find('o',1,3)) #顾头不顾尾,找不到则返回-1不会报错,找到了则显示索引
# print(name.index('e',2,4)) #同上,但是找不到会报错
print(name.count('e',1,3)) #顾头不顾尾,如果不指定范围则查找所有

#center,ljust,rjust,zfill
name='hgz'
print(name.center(30,'-'))
print(name.ljust(30,'*'))
print(name.rjust(30,'*'))
print(name.zfill(50)) #用0填充

#expandtabs
name='egon\thello'
print(name)
print(name.expandtabs(1))

#captalize,swapcase,title
print(name.capitalize()) #首字母大写
print(name.swapcase()) #大小写翻转
msg='egon say hi'
print(msg.title()) #每个单词的首字母大写

#is数字系列
#在python3中
num1=b'4' #bytes
num2=u'4' #unicode,python3中无需加u就是unicode
num3='四' #中文数字
num4='Ⅳ' #罗马数字

#isdigt:bytes,unicode
print(num1.isdigit()) #True
print(num2.isdigit()) #True
print(num3.isdigit()) #False
print(num4.isdigit()) #False

#isdecimal:uncicode
#bytes类型无isdecimal方法
print(num2.isdecimal()) #True
print(num3.isdecimal()) #False
print(num4.isdecimal()) #False

#isnumberic:unicode,中文数字,罗马数字
#bytes类型无isnumberic方法
print(num2.isnumeric()) #True
print(num3.isnumeric()) #True
print(num4.isnumeric()) #True

#三者不能判断浮点数
num5='4.3'
print(num5.isdigit())
print(num5.isdecimal())
print(num5.isnumeric())
'''
总结:
    最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景
    如果要判断中文数字或罗马数字,则需要用到isnumeric
'''

#is其他
print('===>')
name='hgz123'
print(name.isalnum()) #字符串由字母或数字组成
print(name.isalpha()) #字符串只由字母组成

print(name.isidentifier())
print(name.islower())
print(name.isupper())
print(name.isspace())
print(name.istitle())

示例

三、列表

#作用：多个装备，多个爱好，多门课程，多个女朋友等
#定义：[]内可以有多个任意类型的值，逗号分隔
my_friends=['hgz','hgz1','hgz2',4,5] #本质my_friends=list([...])或l=list('abc')

#优先掌握的操作：
#1、按索引存取值(正向存取+反向存取)：即可存也可以取      
#2、切片(顾头不顾尾，步长)
#3、长度
#4、成员运算in和not in
#5、追加
#6、删除
#7、循环

#ps:反向步长
l=[1,2,3,4,5,6]

#正向步长
l[0:3:1] #[1, 2, 3]
#反向步长
l[2::-1] #[3, 2, 1]
#列表翻转
l[::-1] #[6, 5, 4, 3, 2, 1]

四、元组

#作用：存多个值，对比列表来说，元组不可变（是可以当做字典的key的），主要是用来读

#定义：与列表类型比，只不过[]换成()
age=(11,22,33,44,55)  本质age=tuple((11,22,33,44,55))

#优先掌握的操作：
#1、按索引取值(正向取+反向取)：只能取   
#2、切片(顾头不顾尾，步长)
# age=(11,22,33,44,55)
# print(age[0:3])
# print(age)

#3、长度
# age=(11,22,33,44,55)
# print(len(age))

#4、成员运算in和not in
# age=(11,22,33,44,55)
# print(11 in age)

#5、循环
# for item in age:
#     print(item)


#二：该类型总结
# 1 存一个值or存多个值
#     可以存多个值，值都可以是任意类型
# 2 有序
# 3 可变or不可变
#    不可变：值变，id就变。不可变==可hash

五、字典

#作用：存多个值,key-value存取，取值速度快
#定义：key必须是不可变类型，value可以是任意类型
info={'name':'egon','age':18,'sex':'male'} #本质info=dict({....})
或
info=dict(name='hgz',age=18,sex='male')
或
info=dict([['name','hgz'],('age',18)])
或
{}.fromkeys(('name','age','sex'),None)

#优先掌握的操作：
#1、按key存取值：可存可取
#2、长度len
#3、成员运算in和not in
#4、删除
#5、键keys()，值values()，键值对items()
#6、循环

六、集合

#作用：去重，关系运算，

#定义：
            知识点回顾
            可变类型是不可hash类型
            不可变类型是可hash类型

#定义集合:
            集合：可以包含多个元素，用逗号分割，
            集合的元素遵循三个原则：
             1：每个元素必须是不可变类型(可hash，可作为字典的key)
             2:没有重复的元素
             3：无序

注意集合的目的是将不同的值存放到一起，不同的集合间用来做关系运算，无需纠结于集合中单个值
 

#优先掌握的操作：
#1、长度len
#2、成员运算in和not in
#3、|合集
#4、&交集
#5、-差集
#6、^对称差集
#7、==
#8、父集：>,>= 
#9、子集：<,<=

一.关系运算
　　有如下两个集合，readbooks是喜欢readbooks的人的名字集合，play是喜欢play课程玩的人的名字集合
　　readbooks={'hgz','hgz1','hgz2','hgz3','hgz4','hgz5'}
				play={'hgz5','hgz6','hgz7'}
　　1. 求出即报名python又报名linux课程的学员名字集合
　　2. 求出所有报名的学生名字集合
　　3. 求出只报名python课程的学员名字
　　4. 求出没有同时这两门课程的学员名字集合

# 1. 合集 | ：喜欢玩和读的所有人
# print(readbooks | play)
# print(readbooks.union(play))

# 2、&交集:同时喜欢玩和读书的人
# print(readbooks & play)
# print(readbooks.intersection(play))

# 3、^对称差集:没有共同爱好的人
# print(readbooks ^ play)
# print(readbooks.symmetric_difference(play))

# 4  -差集：只喜欢读书的人
# print(readbooks - play)
# print(readbooks.difference(play))

# -差集：只喜欢玩的人
# print(play - readbooks)

# 5 父集:>,>=,子集：<，<=
# s1={1,2,3}
# s2={1,2,}
# print(s1 >= s2)
# print(s1.issuperset(s2))
# print(s2.issubset(s1))

二.去重

　　 1. 有列表l=['a','b',1,'a','a']，列表元素均为可hash类型，去重，得到新列表,且新列表无需保持列表原来的顺序
　　 #去重,无需保持原来的顺序
				l=['a','b',1,'a','a']
				print(set(l))

　　 2.在上题的基础上，保存列表原来的顺序
					#去重,并保持原来的顺序
					#方法一:不用集合
					l=[1,'a','b',1,'a']

					l1=[]
					for i in l:
							if i not in l1:
									l1.append(i)
					print(l1)
					#方法二:借助集合
					l1=[]
					s=set()
					for i in l:
							if i not in s:
									s.add(i)
									l1.append(i)

					print(l1)


　　 3.去除文件中重复的行，肯定要保持文件内容的顺序不变
				 #同上方法二,去除文件中重复的行
				import os
				with open('db.txt','r',encoding='utf-8') as read_f,\
								open('.db.txt.swap','w',encoding='utf-8') as write_f:
						s=set()
						for line in read_f:
								if line not in s:
										s.add(line)
										write_f.write(line)
				os.remove('db.txt')
				os.rename('.db.txt.swap','db.txt')

					#列表中元素为可变类型时,去重,并且保持原来顺序
					l=[
							{'name':'egon','age':18,'sex':'male'},
							{'name':'alex','age':73,'sex':'male'},
							{'name':'egon','age':20,'sex':'female'},
							{'name':'egon','age':18,'sex':'male'},
							{'name':'egon','age':18,'sex':'male'},
					]
					# print(set(l)) #报错:unhashable type: 'dict'
					s=set()
					l1=[]
					for item in l:
							val=(item['name'],item['age'],item['sex'])
							if val not in s:
									s.add(val)
									l1.append(item)

					print(l1)
	 
	 
　　 4.有如下列表，列表元素为不可hash类型，去重，得到新列表，且新列表一定要保持列表原来的顺序
					#定义函数,既可以针对可以hash类型又可以针对不可hash类型
					def func(items,key=None):
							s=set()
							for item in items:
									val=item if key is None else key(item)
									if val not in s:
											s.add(val)
											yield item

					print(list(func(l,key=lambda dic:(dic['name'],dic['age'],dic['sex']))))