第1章 json和pickle模块
1.1什么是序列化?
序列化就是把内存中数据类型转换成一种可以存储到硬盘/基于网络传输的中间格式
反序列化就是将中间格式转成相对应的数据类型
1.2为何要序列化?
1. 持久化数据
2. 数据跨平台交互
1.3如何序列化?
Json
优点:是一种通用的格式
缺点:只能识别部分python数据类型
pickle
优点:可以识别所有python的数据类型
缺点:只能被python识别
1.4Json模块使用:
序列化:
import json
dic={'name':'jiang','age':20}
res=json.dumps(dic)
#将序列化结果写入文件
with open('a.txt','wt',encoding='utf-8') as f:
f.write(res)
反序列化:
import json
with open('a.txt',mode='rt',encoding='utf-8') asf:
dic=json.loads(f.read())
print(dic['name']
1.5dump/load的简化用法:
import json
dic={'name':'jiang','age':10}
with open('a.txt','wt',encoding='utf-8') as f :
json.dump(dic,f)
with open('a.txt','rt',encoding='utf-8') as f :
dic=json.load(f)
print(dic)
1.6Pickle模块使用
序列化:
import pickle
s={1,2,3}
res=pickle.dumps(s)
with open('a.txt',mode='wb') as f:
f.write(res)
反序列化:
with open('e.pkl',mode='rb') as f :
data=f.read()
res=pickle.loads(data)
print(res,type(res))
2.1什么是hash?
Hash:hash是一种算法,该算法接受传入的文本内容,经过hash运算得到一串hash值
2.2Hash值具备特点:
1. 如果传入的内容相同,得到的hash一定相同
2. 不能根据hash值反解出内容
3. 如果采用hash算法固定,那么hash值的长度也是固定的
结合1+3===》文件完整性校验
结合1+2===》传输密文密码
2.3生成hash值:
import hashlib
m=hashlib.md5()
m.update('你好啊'.encode('utf-8'))
m.update('hello'.encode('utf-8'))
res=m.hexdigest()
print(res) #36b20ffdd2e10c6feef8ca866f2ef3b2
m.update('你好'.encode('utf-8'))
m.update('啊hello'.encode('utf-8'))
res=m.hexdigest()
print(res) #36b20ffdd2e10c6feef8ca866f2ef3b2
2.4密码校验功能:
import hashlib
pwd=input('>>: ').strip
m=hashlib.md5()
m.update(pwd.encode('utf-8'))
print(m.hexdigest())
“加盐”,实现较高安全性:
import hashlib
pwd=input('>>: ').strip()
m=hashlib.md5()
m.update('ni'.encode('utf-8'))
m.update(pwd.encode('utf-8'))
m.update('hao'.encode('utf-8'))
print(m.hexdigest())
2.5文件完整性校验:
注意:在文件较大时,生成功hash值也需要一定时间,使用for循环打印每一行,可以节省内存使用率,防止文件过大程序挂掉,对于超大的文件也可以使用只取某一段字符串来进行校验,以达到节省内存的目的
import hashlib
m=hashlib.md5()
with open('f.txt','rb')as f:
for line in f:
m.update(line)
hash_v=m.hexdigest()
print(hash_v)
2.6扩展模块:
import hmac
m=hmac.new('linux运维'.encode('utf-8'))
m.update(b'nihao')
m.update(b'hello')
print(m.hexdigest())
# print(re.findall('alex','my name is alex alex is DSB'))
# print(re.findall('\w','hello123_ * =-'))
# print(re.findall('\W','hello123_ * =-'))
# print(re.findall('\s','hello1\t2\n3_ * =-'))
# print(re.findall('\S','hello1\t2\n3_ * =-'))
# print(re.findall('\d','hello1\t2\n3_ * =-'))
# print(re.findall('\D','hello1\t2\n3_ * =-'))
#从开头匹配alex,找到即返回
# print(re.findall('^alex','alex my name is alex alex is DSB'))
#从结尾匹配DSB,找到即返回
# print(re.findall('DSB$','alex my name is alex alex is DSB '))
# .: 代表匹配一个字符,这一个字符可以是除了\n以外的任意字符,
# print(re.findall('a.c','abc a c a1c aaaaaaac a\nc a\tc',re.DOTALL))
# a.c
#[]: 代表匹配一个字符,这一字符必须是指定范围内的,[0-9] [a-zA-Z]
# print(re.findall('a[0-9]c','a1c a2c aac aaaac aAc'))
# print(re.findall('a[A-Z]c','a1c a2c aac aaaac aAc'))
# print(re.findall('a[A-Za-z]c','a1c a2c aac aaaac aAc'))
# print(re.findall('a[A-Za-z][A-Za-z]c','a1c a2c aac aaaac aAc'))
# print(re.findall('a[+*/-]c','a-c a+c a*c a/c aaac a1c asadfac'))
# print(re.findall('a[^+*/-]c','a-c a+c a*c a/c aaac a1c asadfac'))
4.1日志级别:
critical = 50
error = 40
warning = 30
info = 20
debug = 10
notset = 0#不设置
4.2默认为warning级别,且默认打印到终端
import logging
logging.debug('dehug...')
logging.info('info...')
logging.warning('warning...')
logging.error('error...')
logging.critical('critical...')
4.3logging模块四个对象:
logger:产生日志对象
filter:过滤日志的对象
handler:接受日志然后控制打印到不同的地方,
formatter:可以定制不同的日志格式对象,然后又绑定给不同的handler对象使用
import logging
logger1=logging.getLogger('pay支付服务')
sh=logging.StreamHandler()
fh1=logging.FileHandler('a1.log',encoding='utf-8')
fh2=logging.FileHandler('a2.log',encoding='utf-8')
formatter1=logging.Formatter(
fmt='%(asctime)s - %(name)s - %(levelname)s - %(module)s: %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
)
formatter2=logging.Formatter(
fmt='%(asctime)s : %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
)
logger1.addHandler(sh)
logger1.addHandler(fh1)
logger1.addHandler(fh2)
sh.setFormatter(formatter1)
fh1.setFormatter(formatter1)
fh2.setFormatter(formatter2)
logger1.setLevel(10)
sh.setLevel(10)
fh1.setLevel(10)
fh2.setLevel(10)
logger1.debug('测试信息')
4.4为logging模块指定全局配置,针对所有logger有效,控制打印到文件中:
可在logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有:
filename:用指定的文件名创建FiledHandler(后边会具体讲解handler的概念),这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件,默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。
format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是“2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息
4.5logging配置字典:
import os
import logging.config
# 定义三种日志输出格式开始
standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]'\
'[%(levelname)s][%(message)s]'#其中name为getlogger指定的名字
simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'
id_simple_format = '[%(levelname)s][%(asctime)s] %(message)s'
# 定义日志输出格式结束
logfile_dir = os.path.dirname(os.path.abspath(__file__)) # log文件的目录
logfile_name = 'all2.log' # log文件名
# 如果不存在定义的日志目录就创建一个
if not os.path.isdir(logfile_dir):
os.mkdir(logfile_dir)
# log文件的全路径
logfile_path = os.path.join(logfile_dir, logfile_name)
# log配置字典
LOGGING_DIC = {
'version': 1,
'disable_existing_loggers': False,
'formatters': {
'standard': {
'format': standard_format
},
'simple': {
'format': simple_format
},
},
'filters': {},
'handlers': {
#打印到终端的日志
'console': {
'level': 'DEBUG',
'class': 'logging.StreamHandler', # 打印到屏幕
'formatter': 'simple'
},
#打印到文件的日志,收集info及以上的日志
'default': {
'level': 'DEBUG',
'class': 'logging.handlers.RotatingFileHandler', # 保存到文件
'formatter': 'standard',
'filename': logfile_path, # 日志文件
'maxBytes': 1024*1024*5, # 日志大小5M
'backupCount': 5,
'encoding': 'utf-8', # 日志文件的编码,再也不用担心中文log乱码了
},
},
'loggers': {
#logging.getLogger(__name__)拿到的logger配置
'': {
'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕
'level': 'DEBUG',
'propagate': True, # 向上(更高level的logger)传递
},
},
}
def load_my_logging_cfg():
logging.config.dictConfig(LOGGING_DIC) # 导入上面定义的logging配置
logger = logging.getLogger(__name__) # 生成一个log实例
logger.info('It works!') # 记录该文件的运行状态
if __name__ == '__main__':
load_my_logging_cfg()
import subprocess
import time
obj=subprocess.Popen(
'ps aux',
shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE
)
res=obj.stdout.read()
print(res.decode('utf-8'))
print('以下是错误结果')
res=obj.stderr.read()
print(res.decode('utf-8'))
6.1在python中通常有几种方式来表示时间:
1. 时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量,我们运行type(time.time()),返回的是float类型
2. 格式化的时间字符串(formatString)
3. 结构化的时间(struct_time):struct_time元组共有9个元素(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)
import time
print(time.time())#时间戳
print(time.strftime("%Y-%m-%d %X"))#格式化时间字符串
print(time.localtime())#本地时区的struct_time
print(time.gmtime())#UTC时区的struct_time
其中计算机认识的时间只能是时间戳格式,而程序员可处理的或者说人类可读的是格式化时间字符串和结构化时间
第7章 random模块:import random
print(random.random())#大于0且小于1之间的小数
print(random.randint(1,4))#大于等于1且小于等于4之间的整数
print(random.randrange(1,5))#大于等于1且小于等于5之间的整数
print(random.choice([1,4,'u',6]))#1或者4或者u,或者6
print(random.sample([1,'23',[4,5]],2))#列表元素的任意两个组合
print(random.uniform(1,5))大于1小于3的小数
#打乱item的列表顺序,相当于洗牌
item=[1,3,5,7]
random.shuffle(item)
print(item)
Ø 生成随机验证码:
import random
def make_code(n):
res=''
for i in range(n):
s1=chr(random.randint(65,90))
s2=str(random.randint(0,9))
res+=random.choice([s1,s2])
return res
print(make_code(9))
第8章 os模块:
OS模块是与操作系统交互的一个接口
os.getwd()#获取当前工作目录,即当前python脚本工作饿目录路径
os.chdir()#改变当前脚本工作目录,相当于shell下的cd
os.curdir()#返回当前目录:(’.’)
os.parfir #获取当前目录的父目录字符串名(’..’)
os.makedirs(dirname1/dirname2)可生成多层递归目录
os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove() 删除一个文件
os.rename("oldname","newname") 重命名文件/目录
os.stat('path/filename') 获取文件/目录信息
os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
os.pathsep 输出用于分割文件路径的字符串win下为;,Linux下为:
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command") 运行shell命令,直接显示
os.environ 获取系统环境变量
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) 如果path是绝对路径,返回True
os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path)返回path的大小
第9章 sys模块:sys.argv #命令行参数list,第一个元素是程序本身路径
sys.exit #退出程序,正常退出时exit(0)
sys.version #获取python解释程序版本信息
sys.maxint #最大的int值
sys.path #返回模块的搜索路径,初始化时使用pythonpath环境变量路径
sys.platform #返回操作系统平台名称