好记性不如烂笔头,看到Python Optional Variables这一块,把学习的东西记录下来



一. 可选的环境变量设置

会写Java Hello World的同学一定知道如何设置环境变量,比如:JAVA_HOME,CLASSPATH等。


Python中也一样有类似的环境变量,有一些还是可选的(比如:PYTHONPATH, PYTHONSTARTUP等)

  1. 设置PYTHONPATH

这个环境变量有什么用呢?

我们知道在导入模块时(比如:import some_module_name),Python需要在某些路径(即sys.path这个列表中的路径)中去寻找相应的模块,而PYTHONPATH这个变量就是告诉Python,将它的值也加入到搜索路径中(即将PYTHONPATH的值合并到sys.path列表中)。

export PYTHONPATH=/tmp
python -c "import sys; print 'found' if '/tmp' in sys.path else '' "

输出结果是:found

说明/tmp在sys.path中被找到了(即/tmp附加到了sys.path中)


2. 设置PYTHONSTARTUP

如果这个环境变量的值是一个可读的文件,那么该文件中的Python命令会在交互模式启动之前执行。

echo "print 'hello world'" > /tmp/a.py
export PYTHONSTARTUP=/tmp/a.py
python

在启动python交互模式后,会看到有hello world已经被输出了。


3. 设置PYTHONHOME

一般在这个变量没有被设置的情况下,Python中的sys.path会列出一些模块的搜索路径。

# 比如:
['', '/usr/lib/python2.7', '/usr/lib/python2.7/plat-linux2', 
'/usr/lib/python2.7/lib-tk', '/usr/lib/python2.7/lib-old', 
'/usr/lib/python2.7/lib-dynload', '/usr/local/lib/python2.7/dist-packages', 
'/usr/lib/python2.7/dist-packages']

Python模块的搜索路径一般默认是sys.prefix/lib,可以看到很多路径是 /usr/lib/... 这种,其中/usr 就是sys.prefix这个变量的值(windows上可能是你安装Python的目录,比如: C:\Python2.7)。

如果人工指定了PYTHONHOME,那么sys.prefix的值就会被替换。


随便替换PYTHONHOME的值,可能造成Python无法启动,替换前请备份sys.prefix的值



4. 设置PYTHONCASEOK

这个变量只对Windows起效,可以设置为任意的值(比如:SET PYTHONCASEOK=OK)

设置了以后,Python对模块的导入,将忽略大小写(只对用户module忽略大小写,对built-in module还是大小写敏感)



5. 设置PYTHONIOENCODING

看这个名字,IO Encoding可以猜到这个东西是和输入输出有关的。对,这个环境变量的作用就是指定Python程序标准输入输出(stdin,stdout,stderr)的编码。

关于这个东西的运用,请参考:http://www.soimort.org/posts/118/  太长不看 :D


再补充一些关于encode和decode的要点:

在Python 2.x中,str类型的字符串,都是指string of bytes(二进制流的表示形式),一般来说

1). '...'.decode([encoding_name])是将string of bytes转化成unicode string

运用场景是,从网络或者文件中读取了二进制流,然后将其转化为unicode字符串,便于阅读。


2). u'....'.encode([encoding_name])是将unicode string转化成string of bytes

运用场景是,将unicode字符串转化成二进制流(Java的叫法也称为字节流),然后推向网络或者文件中。


另外,还有两个方法,str.encode和unicode.decode,这两个方法意义不大(几乎很少运用)

"...".encode() 会先默认隐式的用default encoding去decode,即调用"...".decode(sys.getdefaultencoding()) ,然后再继续调用"...".encode()



而u"...".decode()也会先默认隐式的调用u"...".encode(sys.getdefaultencoding()),然后继续调用u"...".decode()



二. 使用pdb模块调试、跟踪脚本

有些时候,需要在没有IDE帮助的情况下,对脚本的运行情况进行调试、跟踪,可以使用Python内置的pdb模块(参考:https://docs.python.org/2/library/pdb.html)

一个简单的例子:

对脚本test.py进行跟踪调试

#! /usr/bin/env python

def foo():
    s = 0
    for i in range(3):
        s += i
    print s


if __name__ == "__main__":
    foo()

运行命令:

python -m pdb test.py

显示类似如下所示:

> /tmp/test.py(3)<module>()
-> def foo():
(Pdb) l
  1      #! /usr/bin/env python
  2      
  3  ->    def foo():
  4          s = 0
  5          for i in range(3):
  6              s += i
  7          print s
  8      
  9      
 10      if __name__ == "__main__":
 11          foo()
(Pdb) n
> /tmp/test.py(10)<module>()
-> if __name__ == "__main__":
(Pdb)


(pdb)是调试提示符,在提示符下可以输入命令(具体参考文档

可以在(pdb)提示符下,查看标量的值,可以使用print 语句打印


常用的简单命令有:

命令全称
简写
命令描述

list
l
列出当前执行脚本的内容(其中有箭头标注当前执行到的位置)

next
n
执行下一步,遇到函数不进入其内部。(相当于IDE中的step over)

step
s
执行下一步,遇到函数进入其内部。(相当于IDE中的step into)

break
b

设置断点,如果不带参数,则列出当前执行脚本中的所有断点(号)。


也可以带参数,比如,执行: b 6)代表在脚本的第6行设置断点,如右边所示,它的断点号是1。

(Pdb) b 6
Breakpoint 1 at /tmp/test.py:6
(Pdb) l
  5          for i in range(3):
  6 B            s += i
  7          print s
  8      
  9      
 10  ->    if __name__ == "__main__":
 11          foo()
clear
cl

清除脚本中的断点。

1)不带参数,会询问是否清除脚本中的所有断点


2)带参数会清除指定的断点。(注意清除的格式)


  • cl(ear) [filename:lineno | bpnumber [bpnumber ...]]

    With a filename:lineno argument, clear all the breakpoints at this line. With a space separated list of breakpoint numbers, clear those breakpoints. Without argument, clear all breaks (but first ask confirmation).


所以,要清除上面设置的第6行的断点,要么使用  cl 1  (清除断点号是1的断点);要么使用  cl test.py:6 (清除test.py中的第6行)


使用 cl 6是错误的,因为目前为止,没有标号是6的断点!!

continue
c
继续执行脚本,直到遇到断点停止。

quit
q
退出调试




That's it!w_0050.gif