一、模块介绍

模块导入方式: import os

os模块是Python标准库中的一个用于访问操作系统相关功能的模块,os模块提供了一种可移植的使用操作系统功能的方法。使用os模块中提供的接口,可以实现跨平台访问。但是,并不是所有的os模块中的接口在全平台都通用,有些接口的实现是依赖特定平台的,比如linux相关的文件权限管理和进程管理。

os模块的主要功能:系统相关、目录及文件操作、执行命令和管理进程

在使用os模块的时候,如果出现了问题,会抛出OSError异常,表明无效的路径名或文件名,或者路径名(文件名)无法访问,或者当前操作系统不支持该操作。

二、系统相关

os模块提供了一些操作系统相关的变量,可以在跨平台的时候提供支持,便于编写移植性高,可用性好的代码。所以在涉及操作系统相关的操作时,请尽量使用本模块提供的方法,而不要使用当前平台特定的用法或格式,否则一旦移植到其他平台,可能会造成难以解决的困扰。

列举os模块中常用的方法和变量,及其用途解释。
os.name #查看当前操作系统的名称。windows平台下返回‘nt’,Linux则返回‘posix’。
os.environ #获取系统环境变量
os.sep #当前平台的路径分隔符。在windows下,为‘\’,在POSIX系统中,为‘/’。
os.altsep #可替代的路径分隔符,在Windows中为‘/’。
os.extsep #文件名和文件扩展名之间分隔的符号,在Windows下为‘.’。
os.pathsep #PATH环境变量中的分隔符,在POSIX系统中为‘:’,在Windows中为‘;’。
os.linesep #行结束符。在不同的系统中行尾的结束符是不同的,例如在Windows下为‘\r\n’。
os.devnull #在不同的系统上null设备的路径,在Windows下为‘nul’,在POSIX下为‘/dev/null’。
os.defpath #当使用exec函数族的时候,如果没有指定PATH环境变量,则默认会查找os.defpath中的值作为子进程PATH的值。

os中定义了一组文件、路径在不同操作系统中的表现形式参数,如:

import os
os.name
‘nt’

os.environ
environ({‘ALLUSERSPROFILE’: ‘C:\ProgramData’, ‘APPDATA’: ‘C:\Users\Administrator\AppData\Roaming’, ‘ASL.LOG’: ‘Destination=file’, …

os.sep
‘\’

os.altsep
‘/’

os.extsep
‘.’

os.pathsep
‘;’

os.linesep
‘\r\n’

os.devnull
‘nul’

os.defpath
‘.;C:\bin’

mac os:

os.name
‘posix’

os.environ
environ({‘HOMEBREW_PREFIX’: ‘/usr/local’, ‘HOMEBREW_CELLAR’: ‘/usr/local/Cellar’, ‘HOMEBREW_REPOSITORY’: ‘/usr/local/Homebrew’, ‘MANPATH’: ‘/usr/local/share/man::’, ‘INFOPATH’: ‘/usr/local/share/info:’, ‘CONDA_EXE’: ‘/Users/kkkkkk/opt/anaconda3/bin/conda’, ‘_CE_M’: ‘’, ‘CE_CONDA’: ‘’, ‘CONDA_PYTHON_EXE’: ‘/Users/kkkkkk/opt/anaconda3/bin/python’, ‘CONDA_SHLVL’: ‘1’, ‘CONDA_PREFIX’: ‘/Users/kkkkkk/opt/anaconda3’, ‘CONDA_DEFAULT_ENV’: ‘base’, ‘CONDA_PROMPT_MODIFIER’: '(base) ', '’: ‘/Users/kkkkkk/opt/anaconda3/bin/python’})

os.sep
‘/’

os.extsep
‘.’

os.pathsep
‘:’

os.linesep
‘\n’

os.altsep
os.devnull
‘/dev/null’

os.defpath
‘/bin:/usr/bin’

三、文件和目录操作

os模块中包含了一系列文件操作相关的函数,其中有一部分是Linux平台专用方法。Linux是用C写的,底层的libc库和系统调用的接口都是C API,Python的os模块中包括了对这些接口的Python实现,通过Python的os模块,可以调用Linux系统的一些底层功能,进行系统编程。关于Linux的相关方法,内容较为复杂,可根据需要自行查阅官方文档,这里只介绍一些常用的,各平台通用的方法。

os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径

os.chdir(“dirname”) 改变当前脚本工作目录;相当于shell下cd

os.curdir 返回当前目录: (’.’)

os.pardir 获取当前目录的父目录字符串名:(’…’)

os.makedirs(‘dirname1/dirname2’) 可生成多层递归目录

os.removedirs(‘dirname1’) 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推

os.mkdir(‘dirname’) 生成单级目录;相当于shell中mkdir dirname

os.rmdir(‘dirname’) 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname

os.listdir(‘dirname’) 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

os.remove() 删除一个文件

os.rename(“oldname”,“newname”) 重命名文件/目录

os.stat(‘path/filename’) 获取文件/目录信息

os.symlink(‘path/filename’,‘ln_filename’) 创建符号链接,源需绝对路径

os.tmpfile() 创建并打开‘w+b’一个新的临时文件

例子

os.chdir("/Users/kkkkkk")
os.getcwd()
‘/Users/kkkkkk’

os.mkdir(‘xxxx’)
os.chdir(“xxxx”)
os.getcwd()
‘/Users/kkkkkk/xxxx’

os.mkdir(‘test1’)
os.mkdir(‘test2’)
os.mkdir(‘test3’)
os.listdir(os.getcwd())
[‘test1’, ‘test3’, ‘test2’]

os.makedirs(‘test4/t1/t2’)
os.rmdir(‘test1’)
os.getcwd()
‘/Users/kkkkkk/xxxx’

os.listdir(os.getcwd())
[‘test4’, ‘test3’, ‘test2’]

os.rename(‘test2’,‘newtest2’)
os.listdir(os.getcwd())
[‘newtest2’, ‘test4’, ‘test3’]

os.removedirs(‘test4’)
Traceback (most recent call last):
File “”, line 1, in
File “/Users/kkkkkk/opt/anaconda3/lib/python3.8/os.py”, line 241, in removedirs
rmdir(name)
OSError: [Errno 66] Directory not empty: ‘test4’

os.removedirs(‘test4/t1/t2’)
os.listdir(os.getcwd())
[‘newtest2’, ‘test3’]

os.stat(os.getcwd())
os.stat_result(st_mode=16877, st_ino=16401778, st_dev=16777221, st_nlink=4, st_uid=501, st_gid=20, st_size=128, st_atime=1634884114, st_mtime=1634884070, st_ctime=1634884070)

os.walk() 生成一个目录树下的所有文件名

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top表示需要遍历的目录树的路径
topdown的默认值是”True”,表示首先返回目录树下的文件,然后在遍历目录树的子目录.Topdown的值为”False”时,则表示先遍历目录树的子目录,返回子目录下的文件,最后返回根目录下的文件
onerror的默认值是”None”,表示忽略文件遍历时产生的错误.如果不为空,则提供一个自定义函数提示错误信息后继续遍历或抛出异常中止遍历

该函数返回一个元组,该元组有3个元素,这3个元素分别表示每次遍历的路径名,目录列表和文件列表

>>> for root, dirs, files in os.walk("wd/chat", topdown=False):
... for name in files:
...  print(os.path.join(root, name)) #打印文件绝对路径
... for name in dirs:
...  print(os.path.join(root, name)) #打印目录绝对路径

os.path常用模块详解

os.path.abspath(path) #返回path规范化的绝对路径
os.path.exists(path或者file) #如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) #如果path是绝对路径,返回True
os.path.isfile(path) #如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path) #如果path是一个存在的目录,则返回True。否则返回False
os.path.getatime(path) #返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path) #返回path所指向的文件或者目录的最后修改时间
os.path.getsize(filename) #返回文件包含的字符数量

os.path.split(path)

将路径path分解为(文件夹,文件名),返回的是元组类型。
若路径字符串最后一个字符是\,则只有文件夹部分有值;
若路径字符串中均无\,则只有文件名部分有值。
若路径字符串有\,且不在最后,则文件夹和文件名均有值。
且返回的文件夹的结果不包含\。

>>> os.path.split('../')
('..', '')
>>> os.path.split('.')
('', '.')
>>> os.path.split('/user')
('/', 'User')
>>> os.path.split('/user/www/index.py')
('/user/www', 'index.py')
>>> os.path.split('/User/www/')
('/user/www', '')

os.path.join(path1[, path2[, …]])

将多个路径组合后返回,第一个绝对路径之前的参数将被忽略

>>> os.path.join('/user/www/','api')
'/user/www/api'
>>> os.path.join('/user/www/','api/lib')
'/user/www/api/lib'
>>> os.path.join('/user/www/','api/lib/os.py')
'/user/www/api/lib/os.py'
>>> os.path.join('/user/www/','index.py')
'/user/www/index.py'
>>> os.path.join('/user/www/','index.py','/other/')
'/other/'
>>> os.path.join('/user/www/','index.py','/other/','new.py')
'/other/new.py'
>>> os.path.join('/user/www/','index.py','/other','new.py')
'/other/new.py'

os.path.dirname(path)

返回path的目录。其实就是os.path.split(path)的第一个元素

>>> os.path.dirname('/User')
'/'
>>> os.path.dirname('/User/www/')
'/User/www'
>>> os.path.dirname('/User/www/index.py')
'/User/www'

os.path.basename(path)
返回path最后的文件名。如果path以/或\结尾,那么就会返回空值。

>>> os.path.basename('/User')
'User'
>>> os.path.basename('/User/www')
'www'
>>> os.path.basename('/User/www/')
''
>>> os.path.basename('/User/www/index.py')
'index.py'

os.path.walk(top,func,arg)

top表示需要遍历的目录树的路径
func表示回调函数,对遍历路径进行处理.所谓回调函数,是作为某个函数的参数使用,当某个时间触发时,程序将调用定义好的回调函数处理某个任务.回调函数必须提供3个参数:第1个参数为walk()的参数tag,第2个参数表示目录列表,第3个参数表示文件列表
arg是传递给回调参数func的元组.回调函数的一个参数必须是arg,为回调函数提供处理参数.参数arg可以为空

执行命令

在早期的Python版本中,通常使用os模块的system或者popen等方法执行操作系统的命令。但是,最近Python官方逐渐弃用了这些命令,而是改用内置的subprocess模块执行操作系统相关命令。

os.system(“bash command”)

运行操作系统命令,直接显示结果。但返回值是0或-1,不能获得显示在屏幕上的数据。 command是要执行的命令字符串。

os.system(‘ls -l’)
total 9
drwxrwxr-x+ 27 root admin 864 9 17 09:55 Applications
drwxr-xr-x 64 root wheel 2048 3 10 2021 Library
drwxr-xr-x@ 8 root wheel 256 9 22 2020 System

ret = os.system(‘ifconfig’)
lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384
options=1203<RXCSUM,TXCSUM,TXSTATUS,SW_TIMESTAMP>
inet 127.0.0.1 netmask 0xff000000
inet6 ::1 prefixlen 128
inet6 fe80::1%lo0 prefixlen 64 scopeid 0x1
nd6 options=201<PERFORMNUD,DAD>
省略

type(ret)
<class ‘int’>

print(ret)
0

os.popen(command, [mode, [bufsize]])

运行shell命令,生成对象,可赋给变量,再用read读取
开启一个子进程执行command参数指定的命令,在父进程和子进程之间建立一个管道pipe,用于在父子进程间通信。该方法返回一个文件对象,可以对这个文件对象进行读或写,取决于参数mode,如果mode指定了只读,那么只能对文件对象进行读,如果mode参数指定了只写,那么只能对文件对象进行写操作。

简而言之,popen也可以运行操作系统命令,并通过read()方法将命令的结果返回


>>> ret = os.popen('ls -l')
>>> ret.readlines()
['chat_client_twisted.py\n', 'chat_server_twisted.py\n']

>>> os.popen('ifconfig')
<os._wrap_close object at 0x7ffe44aef2e8>
>>> ret = os.popen('ifconfig')
>>> ret.read()