python 数据分析 os包 常用函数记录

  • 递归查找目录下的数据文件 os.walk() os.listdir(path)
  • 获取路径的文件名 os.path.basename(filePath)
  • 创建目录 os.makedirs(path)
  • 拼接路径 os.path.join(rootpath, file)
  • 判断尝试访问的路径是否存在 os.access(path, mode)
  • 网上找到的一些有趣的funtion


递归查找目录下的数据文件 os.walk() os.listdir(path)

os.walk() 方法是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。

param

  • top =top是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
    root 所指的是当前正在遍历的这个文件夹的本身的地址
    dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
    files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
  • topdown * --可选,为 True,则优先遍历 top 目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top 文件夹中每一个子目录。*
  • onerror – 可选,需要一个 callable 对象,当 walk 需要异常时,会调用。
  • followlinks – 可选,如果为 True,则会遍历目录下的快捷方式(linux 下是软连接 symbolic link )实际所指的目录(默认关闭),如果为 False,则优先遍历 top 的子目录。

使用
os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])

os.listdir(path) 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。

pathList = os.listdir(path)

获取路径的文件名 os.path.basename(filePath)

用在遍历出文件路径之后可以提取文件名

创建目录 os.makedirs(path)

用于创建递归目录

拼接路径 os.path.join(rootpath, file)

用于拼接路径

判断尝试访问的路径是否存在 os.access(path, mode)

param
  • path – 要用来检测是否有访问权限的路径。
  • mode– mode为F_OK,测试存在的路径,或者它可以是包含R_OK, W_OK和X_OK或者R_OK, W_OK和X_OK其中之一或者更多。
    os.F_OK: 作为access()的mode参数,测试path是否存在。
    os.R_OK: 包含在access()的mode参数中 , 测试path是否可读。
    os.W_OK 包含在access()的mode参数中 , 测试path是否可写。
    os.X_OK 包含在access()的mode参数中 ,测试path是否可执行。

网上找到的一些有趣的funtion

# 递归查找文件的
	def getFiles(path, suffix):
    return [os.path.join(root, file) for root, dirs, files in os.walk(path) for file in files if file.endswith(suffix)]