作者:csj
回主目录:2017 年学习记录和总结
1.python 简介:
2.python 解释器
3.python基础:
1.数据类型,变量,字符串,编码
2.list,tuple,set,dict,
3.条件判断,循环
4.函数及参数,递归函数,包函数,匿名函数,偏函数
5.切片,迭代,列表生成式,生成器
6.函数式编程,高阶函数map,reduce,filter,zip,sorted
7.装饰器,模块,
8.错误处理,调试,测试
9.IO文件读写
10.序列化,进程,多线程
11.正则表达式
12.常用内建模块
13.常用web框架flask,django
-----------------------------------------------------------------------------
1.python 简介:
1.python被称为胶水语言,意思是无所不能,哪里都可以使用python来开发,由此可见python现在是非常火的,特别是现在人工智能,机器学习比较火的时候,好都人都在学习python.
2.Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。目前有python2.* 和python3.*在工业界使用,
如果你现在开始学习python,建议从pyton3.*开始学,因python2.*从2020年,开始不在提供支持和更新.
2.python 解释器
以.py为扩展名的文本文件,要运行代码,就需要Python解释器去执行.py文件。
目前开发的IDE有:pychart,sublime text2/sublime text3
3.python基础:
1.数据类型,变量,字符串,编码
int,double,str,bool,None,常量
a=2
b=2.12
c='test'
d= True
e=None
pai=3.1415927
需要注意的事python的 数据类型不用定义,解释器会根据数据的类型自动匹配数据类型;
python支持多种数据类型,在计算机内部,可以把任何数据都看成一个“对象”.
ord('A')#print65
char(66) #print B
2.list,tuple,set,dict,
直接上列子吧,最直观:
-------------list--------------------
list0=[]
list1=[1,2,3,4]
list2=['a','b','c']
list3=[1,2.12,'a',list1]
type(list3)
print(list3[0] #index get value
list4 = list1 + list2
list5 = list1 * 3
len(list5)
for i in list5:
print(i)
list6 = 2 in list5
del list6[1]
del list6
max(list6)
min(list6)
list5[1:4]
list5[1:4:2]
list5[2:]
list5[:4]
list5=['a','b']#updated value
list5.append(),list5.count('a'),list5.extend(val),list5.index(obj),list.instert(index,obj),
list5.pop('a')
list.remove(valu)
del list['valu']
----------tuple-------------------------
tuple1=()
tuple2=(1,2,3)
tuple function:索引,切片,连接,复制,对内部元素循环,查找某元素是否存在,删除元组,还回最大最小值 参考list,不一一列出
元组和列表相互转化
tuple1=(1,2,3)
list1=['a','b','c']
tuple2=tuple(list1)
list2=list(tuple1)
list3 = [n+m for n in 'abc' for m in 'ABC']
元组打包解包:
tuple4=1,2,3,4
a,b,c,d=tuple4
----------------------dict funciton----------------------------------------
dict1={}
dict2={'a':1,'b':2,'c':3}
dict3=dict(['a',10],['b',20])
dict4 = dict((('a',10),('b',20)))
dict5=dict(a=10,b=20)
dict6=[1:10,2:20]
dict1['a']
dict7 = 'a' in dict1 #true or false
dict1.keys()
dict1.values()
dict1.items()
dict1.clear()
dict1.get(key,default=None)
dict1.pop(key)
dict1.setdefault(key,default=none)
dict1.update(newdict)
dict8=copy.deepcopy(dict2)
-------------------------set ----------------------------------------------------------------------
不重复的无序集{},不能使用列表,字典当做元素
set0=set{}
set1 ={1,2,3,4,5}
set2={1,2.33,'test',(1,2)}
set1.add(x)
set9 =set1.updte(set2)
set1.pop()#执行一次按顺序删除一个元素
set1.remove(x)
set1.discard(x)
set1.clear()
set1.intersection(set2)
set1.untion(set2)
set1.diffrence(set2)
set1.issubset(set2)
3.条件判断,循环
if a<10:
elif a<20:
else:
for x in list1:
4.函数及参数,递归函数,包函数,匿名函数,偏函数
def def1():
def def2(a)
def def3(a,b=2,c='shenzhen')
def def4(a,*b,**kw):
def def5(a,b,*,city,name)#命名关键字参数,必须用*分隔,后面的事命名关键字参数
递归函数:函数内部调用其他函数,调用自己也是;
匿名函数:f1= lambda x:x+x
5.切片,迭代,列表生成式,生成器
list1=[1,2,3,4,5,6]
list2=list1[1:4]
迭代:可以遍历的集合称之为迭代;
for k in dict:
print(k)
python内置的额函数enumerate可以将list变成索引-元素对,这样可以使用for 循环迭代;
for x,y in enumerate(['a','b','c']):
print(x,y)
list1=[x for x in range(10)]
生成器:i = (x for x in range(10)) #generator yioid
next(i)
凡是可作用于for循环的对象都是Iterable类型;
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
6.函数式编程,高阶函数,map,reduce,filter,zip,sorted
函数式编程:就是面向过程的编程,将任务分成若干个小任务,每个小任务由一个函数来完成功能;
高阶函数:允许接受函数为为参数的函数称为高阶函数;
map:接受一个函数,一个序列,将传入的函数参数作用于序列每一个元素上并还回一个list
map(fn[1,2,3,4]
reduce:将函数依次作用于连续的每2个元素上并还回一个结果和;
reduce(fn,[1,2,3,4]
filter():接受一个函数,一个序列,将传入的函数参数作用于序列每一个元素上并根据还回的ture or false,决定是否丢弃对象到还回结果集
sorted():高级函数,接受函数和序列,函数作用于每一个序列元素上;
7.装饰器,模块,
def now():
f = now
f.__name__ #now
装饰器 在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)。
decorator就是一个返回函数的高阶函数
8.错误处理,调试,测试
错误处理
try:
print('try...')
except ZeroDivisionError as e: #更多错误处理类可以网上查询:ioerror,valueerror,
print('except::',e)
finally:
print('finllay...')
调试
1.是用print()把可能有问题的变量打印出来看看;
2.凡是用print()来辅助查看的地方,都可以用断言(assert)来替代;如果断言失败,assert语句本身就会抛出AssertionError:
3.把print()替换为logging是第3种方式,和assert比,logging不会抛出错误,而且可以输出到文件 logging.info('n = %d' % n)
import logging
logging.basicConfig(level=logging.INFO)
logging的好处,它允许你指定记录信息的级别,有debug,info,warning,error等几个级别,当我们指定 level=INFO时,logging.debug就不起作用了
第4种方式是启动Python的调试器pdb,让程序以单步方式运行,可以随时查看运行状态
目前比较好的Python IDE有PyCharm,不过好像要收费,但网上可以找到注册码~~
讲了这么多调试方法,不过虽然用IDE调试起来比较方便,但是最后你会发现,logging才是终极武器。
测试:
单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作
9.IO文件读写
f = open('/Users/michael/test.txt', 'r') #'r'表示
f.read()
f.close()
readlines()一次读取所有内容并按行返回list
readline()可以每次读取一行内容
read(size)方法,每次最多读取size个字节的内容
read()会一次性读取文件的全部内容
for line in f.readlines():
print(line.strip()) # 把末尾的'\n'删掉
要读取二进制文件,比如图片、视频等等,用'rb'模式打开文件即可,'w'写文件
f = open('/Users/michael/test.jpg', 'rb')
f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')
10.序列化,进程,多线程
Python语言特定的序列化模块是pickle,但如果要把序列化搞得更通用、更符合Web标准,就可以使用json模块。
json模块的dumps()和loads()函数是定义得非常好的接口的典范.
pickling:
pickle.dumps(d)# str to bites
pickle.loads()方法反序列化出对象 @ bites to str
要把JSON反序列化为Python对象,用loads()或者对应的load()方法
print(json.dumps(s, default=lambda obj: obj.__dict__)) #把任意class的实例变为dict
把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling
序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。
unpickling:
反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
import pickle
>>> d = dict(name='Bob', age=20, score=88)
>>> pickle.dumps(d)
pickle.dumps()方法把任意对象序列化成一个bytes,然后,就可以把这个bytes写入文件。或者用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object
>>> f = open('dump.txt', 'wb')
>>> pickle.dump(d, f)
>>> f.close()
多进程:
Python既支持多进程,又支持多线程
线程是最小的执行单元,而进程由至少一个线程组成。如何调度进程和线程,完全由操作系统决定,程序自己不能决定什么时候执行,执行多长时间
11.正则表达式, re模块
[0-9a-zA-Z\_]可以匹配一个数字、字母或者下划线;
[0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'a100','0_Z','Py3000'等等;
[a-zA-Z\_][0-9a-zA-Z\_]*可以匹配由字母或下划线开头,后接任意个由一个数字、字母或者下划线组成的字符串,也就是Python合法的变量;
[a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)
re.split(r'\s+', 'a b c')
正则表达式非常强大,在这里只是提了一点点,具体的可以网上查询。
12.常用内建模块
1.datetime是Python处理日期和时间的标准库
1.获取当前日期和时间
2.获取指定日期和时间
3.datetime转换为timestamp
4.timestamp转换为datetime
5.str转换为datetime
6.datetime转换为str
7.datetime加减
8.本地时间转换为UTC时间
9.时区转换
from datetime import datetime
now = datetime.now() # 获取当前datetime
datetime(2015, 4, 19, 12, 20)
cday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%d %H:%M:%S')
print(now.strftime('%a, %b %d %H:%M'))
now + timedelta(hours=10)
utc_dt = datetime.utcnow().replace(tzinfo=timezone.utc)
2.urllib
3.HTMLparser
4.XML
5.base64
13.常用python web框架
flask(小型),用过,适用于小型项目;
django(大型):
web这块涉及内容较多,具体的大家可以在网上查找学习,这里不一一说明.
-----------------------------end------------------------------------