python基础知识总结

精选转载

mikeluwen 2014-07-08 22:47:31 博主文章分类：python技术

文章标签 python基础 文章分类 Python 后端开发

python有段时间没用了，实在是惭愧啊，屌丝今天决定开始对python基础知识重新进行总结，以慰自心。

一.python概念

Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间，为了打发无聊的圣诞节而编写的一个编程语言。
python定位“优雅”，“简单”，“明确”

二.python安装

略

三.python基础

1.输入输出

输入输出input/output，简称I/O

输出：

print 语句也可以跟上多个字符串，用逗号“,”隔开，就可以连成一串输出,逗号在print语句里面看做空格，print可以输出整数和进行运算输出结果

输入：

raw_input：输入值并存放到变量里面

变量相信不需要多说了

2.数据类型

整数：

Python可以处理任意大小的整数，当然包括负整数，在程序中的表示方法和数学上的写法一模一样，例如：1，100，-8080，0，等等。

计算机由于使用二进制，所以，有时候用十六进制表示整数比较方便，十六进制用0x前缀和0-9，a-f表示，例如：0xff00，0xa5b4c3d2，等等。

浮点数：

浮点数也就是小数，之所以称为浮点数，是因为按照科学记数法表示时，一个浮点数的小数点位置是可变的，比如，1.23x10⁹和12.3x10⁸是相等的。浮点数可以用数学写法，如1.23，3.14，-9.01，等等。但是对于很大或很小的浮点数，就必须用科学计数法表示，把10用e替代，1.23x10⁹就是1.23e9，或者12.3e8，0.000012可以写成1.2e-5，等等。

整数和浮点数在计算机内部存储的方式是不同的，整数运算永远是精确的（除法难道也是精确的？是的！），而浮点数运算则可能会有四舍五入的误差。

字符串：

字符串是以''或""括起来的任意文本，比如'abc'，"xyz"等等。请注意，''或""本身只是一种表示方式，不是字符串的一部分，因此，字符串'abc'只有a，b，c这3个字符。如果'本身也是一个字符，那就可以用""括起来，比如"I'm OK"包含的字符是I，'，m，空格，O，K这6个字符。

如果字符串内部既包含'又包含"怎么办？可以用转义字符\来标识，比如：转义字符\可以转义很多字符，比如\n表示换行，\t表示制表符，字符\本身也要转义，所以\\表示的字符就是\

如果字符串里面有很多字符都需要转义，就需要加很多\，为了简化，Python还允许用r''表示''内部的字符串默认不转义

如果字符串内部有很多换行，用\n写在一行里不好阅读，为了简化，Python允许用'''...'''的格式表示多行内容。

布尔值：

布尔值和布尔代数的表示一致。布尔值只有True或者False两种值，python可以用True 或 False表示布尔值，注意大小写，也可以通过布尔运算，比如：

>>> True

True

>>> False

False

>>> 3 > 2

True

>>> 3 > 5

False

布尔值可以用and or not 来运算，and是与运算，都是True才会是True，or是或运算，有一个True就为True,not是单目运算符，表示非运算True变False，False变True。

布尔值一般用在条件判断中

空值：

空值是Python里一个特殊的值，用None表示。None不能理解为0，因为0是有意义的，而None是一个特殊的空值。

python还有列表，元组，字典，还有自定义数据类型，后面一一整理道来

变量：

大小写英文字母，数字，_下划线且不能以数字开头，可以表示各种数据类型

动态语言：变量本身类型不固定的称为动态语言，反之就是静态语言，如java，声明时必须指定类型

a='aaa'

表示在内存中创建aaa字符串，在内存中创建a变量，并将a变量指向aaa

a=b

表示将a变量指向b变量的值

常量：

不能变的变量，例如PI,python中没有机制表示常量不能变，一般习惯用大写字母来表示常量

3.字符串和编码

字符串是一种数据类型，字符串有一个问题就是编码问题，计算机只能处理数字，要处理文本，必须将文本用数字来表示，这样就有了编码，而计算机是由美国人发明的，英文可以用一个字节表示，最早只有127个字符被编码到计算机，这个编码表称为ASCII码，但处理中文一个字节不够，至少需要两个字节，而且还不能和ASCII码冲突，所以，中国制定了GB2312码

全世界语言那么多，各国有各国的标准，不可避免的会有冲突，unicode就这样产生了，unicode通常是两个字节，非常偏僻的字才用更多字节，ASCII码前面补0就是unicode码了

用unicode码也有问题，虽然统一用unicode编码乱码问题解决了，但是占用空间大了，这样就有了可变长编码utf-8

utf-8将一个unicode字符根据不同数字大小编码成1-6个字节，常用的英文字母编码为一个字节，汉字通常三个字节，很生僻的字符才会编码成4-6个字节，如果用于大量英文，utf-8可以节省很多空间。UTF-8还一个好处就是ASCII码实际可以看做utf-8的一部分，大量支持ASCII码的历史遗留软件可以在utf-8编码下继续工作。

搞清楚了ASCII、Unicode和UTF-8的关系，我们就可以总结一下现在计算机系统通用的字符编码工作方式：

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件

浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器，所以你看到很多网页的源码上会有类似<meta charset="UTF-8" />的信息，表示该网页正是用的UTF-8编码。

4.python字符串

python诞生比unicode早，所以最早的python只支持ASCII码，字母和数字对应，python提供了ord()和chr()函数将字母和相应的数字兑换，python后来添加了对unicode支持，unicode字符串表示u'...','...'可以看做utf-8编码或者ASCII编码，但是u'...'只能看做unicode编码，英文表示的unicode编码和utf-8编码一样，但是占用的空间不同，而中文字符转换后一个unicode字符将变为三个utf-8字符，len()函数返回字符串长度，将utf-8字符转换为unicode字符，用decode('utf-8'),python源码也是一个文本文件，一般保存为utf-8，#coding utf-8

5.格式化

最常见的是输出格式化的字符串，python的格式化和c语言一致，%s用字符串替换，%d用整数替换，如果只有一个%？，括号可以省略，

常见的占位符：

%s 字符串

%d 整数

%f 浮点数

%x 十六进制整数

记住：格式化整数和浮点数可以指定是否补0和整数和小数的位数

>>> '%2d-%02d' % (3, 1)
' 3-01'
>>> '%.2f' % 3.1415926
'3.14'

如果你不确定用什么，%s可以将任何数据类型转换为字符串

>>> 'Age: %s. Gender: %s' % (25, True)
'Age: 25. Gender: True'

对于unicode字符，用法完全一样，但最好确保替换的字符串也是unicode字符串

>>> u'Hi, %s' % u'Michael'
u'Hi, Michael'

如果字符串的%也是一个普通字符，这就需要转义，%%表示%

待续。。。

上一篇：centos7.0的几个新特性

下一篇：docker在centos7.0中的使用

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python基础知识总结

python基础知识总结

51CTO博客