python有段时间没用了,实在是惭愧啊,屌丝今天决定开始对python基础知识重新进行总结,以慰自心。
一.python概念
Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。
python定位“优雅”,“简单”,“明确”
二.python安装
略
三.python基础
1.输入输出
输入输出input/output,简称I/O
输出:
print 语句也可以跟上多个字符串,用逗号“,”隔开,就可以连成一串输出,逗号在print语句里面看做空格,print可以输出整数和进行运算输出结果
输入:
raw_input:输入值并存放到变量里面
变量相信不需要多说了
2.数据类型
整数:
Python可以处理任意大小的整数,当然包括负整数,在程序中的表示方法和数学上的写法一模一样,例如:1
,100
,-8080
,0
,等等。
计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制用0x
前缀和0-9,a-f表示,例如:0xff00
,0xa5b4c3d2
,等等。
浮点数:
浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,比如,1.23x109和12.3x108是相等的。浮点数可以用数学写法,如1.23
,3.14
,-9.01
,等等。但是对于很大或很小的浮点数,就必须用科学计数法表示,把10用e替代,1.23x109就是1.23e9
,或者12.3e8
,0.000012可以写成1.2e-5
,等等。
整数和浮点数在计算机内部存储的方式是不同的,整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差。
字符串:
字符串是以''或""括起来的任意文本,比如'abc'
,"xyz"
等等。请注意,''或""本身只是一种表示方式,不是字符串的一部分,因此,字符串'abc'
只有a
,b
,c
这3个字符。如果'
本身也是一个字符,那就可以用""括起来,比如"I'm OK"
包含的字符是I
,'
,m
,空格,O
,K
这6个字符。
如果字符串内部既包含'又包含"怎么办?可以用转义字符\来标识,比如:转义字符\可以转义很多字符,比如\n表示换行,\t表示制表符,字符\本身也要转义,所以\\表示的字符就是\
如果字符串里面有很多字符都需要转义,就需要加很多\,为了简化,Python还允许用r''表示''内部的字符串默认不转义
如果字符串内部有很多换行,用\n写在一行里不好阅读,为了简化,Python允许用'''...'''的格式表示多行内容。
布尔值:
布尔值和布尔代数的表示一致。布尔值只有True或者False两种值,python可以用True 或 False表示布尔值,注意大小写,也可以通过布尔运算,比如:
>>> True
True
>>> False
False
>>> 3 > 2
True
>>> 3 > 5
False
布尔值可以用and or not 来运算,and是与运算,都是True才会是True,or是或运算,有一个True就为True,not是单目运算符,表示非运算True变False,False变True。
布尔值一般用在条件判断中
空值:
空值是Python里一个特殊的值,用None表示。None不能理解为0,因为0是有意义的,而None是一个特殊的空值。
python还有列表,元组,字典,还有自定义数据类型,后面一一整理道来
变量:
大小写英文字母,数字,_下划线且不能以数字开头,可以表示各种数据类型
动态语言:变量本身类型不固定的称为动态语言,反之就是静态语言,如java,声明时必须指定类型
a='aaa'
表示在内存中创建aaa字符串,在内存中创建a变量,并将a变量指向aaa
a=b
表示将a变量指向b变量的值
常量:
不能变的变量,例如PI,python中没有机制表示常量不能变,一般习惯用大写字母来表示常量
3.字符串和编码
字符串是一种数据类型,字符串有一个问题就是编码问题,计算机只能处理数字,要处理文本,必须将文本用数字来表示,这样就有了编码,而计算机是由美国人发明的,英文可以用一个字节表示,最早只有127个字符被编码到计算机,这个编码表称为ASCII码,但处理中文一个字节不够,至少需要两个字节,而且还不能和ASCII码冲突,所以,中国制定了GB2312码
全世界语言那么多,各国有各国的标准,不可避免的会有冲突,unicode就这样产生了,unicode通常是两个字节,非常偏僻的字才用更多字节,ASCII码前面补0就是unicode码了
用unicode码也有问题,虽然统一用unicode编码乱码问题解决了,但是占用空间大了,这样就有了可变长编码utf-8
utf-8将一个unicode字符根据不同数字大小编码成1-6个字节,常用的英文字母编码为一个字节,汉字通常三个字节,很生僻的字符才会编码成4-6个字节,如果用于大量英文,utf-8可以节省很多空间。UTF-8还一个好处就是ASCII码实际可以看做utf-8的一部分,大量支持ASCII码的历史遗留软件可以在utf-8编码下继续工作。
搞清楚了ASCII、Unicode和UTF-8的关系,我们就可以总结一下现在计算机系统通用的字符编码工作方式:
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。
用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件
浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器,所以你看到很多网页的源码上会有类似<meta charset="UTF-8" />的信息,表示该网页正是用的UTF-8编码。
4.python字符串
python诞生比unicode早,所以最早的python只支持ASCII码,字母和数字对应,python提供了ord()和chr()函数将字母和相应的数字兑换,python后来添加了对unicode支持,unicode字符串表示u'...','...'可以看做utf-8编码或者ASCII编码,但是u'...'只能看做unicode编码,英文表示的unicode编码和utf-8编码一样,但是占用的空间不同,而中文字符转换后一个unicode字符将变为三个utf-8字符,len()函数返回字符串长度,将utf-8字符转换为unicode字符,用decode('utf-8'),python源码也是一个文本文件,一般保存为utf-8,#coding utf-8
5.格式化
最常见的是输出格式化的字符串,python的格式化和c语言一致,%s用字符串替换,%d用整数替换,如果只有一个%?,括号可以省略,
常见的占位符:
%s 字符串
%d 整数
%f 浮点数
%x 十六进制整数
记住:格式化整数和浮点数可以指定是否补0和整数和小数的位数
>>> '%2d-%02d' % (3, 1) ' 3-01' >>> '%.2f' % 3.1415926 '3.14'
如果你不确定用什么,%s可以将任何数据类型转换为字符串
>>> 'Age: %s. Gender: %s' % (25, True) 'Age: 25. Gender: True'
对于unicode字符,用法完全一样,但最好确保替换的字符串也是unicode字符串
>>> u'Hi, %s' % u'Michael' u'Hi, Michael'
如果字符串的%也是一个普通字符,这就需要转义,%%表示%
待续。。。