Effective Python chap.1 用Pythonic方式来思考

Pythonic: 一门语言的编程习惯是由用户来确立的。

1. 确认自己所使用的Python版本


2. 遵循PEP8风格指南

每件事都应该有直白的做法,而且最好只有一种。

  • 模块级别常量 全部采用大写字母拼写 例如 ALL_CAPS
  • 类的实例方法首个参数命名为self
  • 类方法首个参数命名为cls
  • 否定词内联,而不是放在前面,例如 if a is not b 而不是 if not a is b
  • 不要使用相对路径进行引用
  • import语句按顺序分为三个部分,标准库模块→第三方模块→自用模块

3. 了解bytes、str与unicode的区别

Python3表示字符序列的类型: bytes和str, 前者包含原始8位值, 后者包含Unicode字符;
Python2表示字符序列的类型: str和unicode, 前者包含原始8位值, 后者包含Unicode字符。

Unicode→.encode('utf-8')→原始8位值→.decode('utf-8')→原始8位值

Unicode字符可以显示正常的中文。

程序的核心部分应该使用Unicode字符类型,最好是UTF-8。能够保证程序能够接受多种类型的文本编码,又可以保证输出的文本信息只采用一种编码格式。
这也就是为什么要加# -*- coding: utf-8 -*-

从文件中读取二进制数据,或向其中写入二进制数据时,总应该以rbwb等二进制模式来开启文件。


4. 用辅助函数来取代复杂的表达式

表达式如果比较复杂,就要拆解成小块,并移到辅助函数中。


5. 了解切割序列的办法

切割办法可以用于实现了__getitem____setitem__这两个方法的类上。

对原列表进行切割后,会产生另外一份全新的列表。拷贝:b = a[:]

对list进行赋值的时候使用切片,可以覆盖范围内的值,哪怕左右长度不同。
a[:3] = [101, 102, 103]


6. 在单次切片操作内,不要同时指定start、end和stride

列表反转: b = a[::-1],对UTF-8字符串的Unicode无效。
可以很方便的实现对数据的等步取样。
a[::2] a[::-2] 从头开始(从尾开始)每两个元素选取一个,注意后面的是逆序输出。

建议:先做步进式切片,赋值给某个变量后,再做二次切割。也可以先做范围切割,再做步进切割。