HDFS中的文件访问权限
针对文件和目录,HDFS的权限模式与POSIX非常相似
一共提供三类权限模式:只读权限(r)、写入权限(w)和可执行权限(x)。
读取文件或列出目录内容时需要只读权限。写入一个文件或是在一个目录上新建及删除文件或目录,需要写入权限。对于文件而言,可执行权限可以忽略,因为你不能再HDFS中执行文件(与POSIX不同),但在访问一个目录的子项时需要改权限。
每个文件和目录都有所属用户(owner)、所属组别(group)及模式(mode)。这个模式是由所属用户的权限、组内成员的权限及其他用户的权限组成的。
在默认情况下,可以通过正在运行进程的用户名和组名来唯一确定客户端的标识。但由于客户端是远程的,任何用户都可以简单地在远程系统上以其名义新建一个账户来进行访问。因此,作为共享文件系统资源和防止数据意外损失的一种机制,权限只能供合作团体中的用户使用,而不能用于在一个不友好的环境中保护资源。注意,最新版的Hadoop已经支持Kerberos用户认证,该认证去除了这些限制。但是,除了上述限制外,为防止用户或自动工具及程序意外修改或删除文件系统的重要部分,启用权限控制还是很重要的,这也是默认的配置,参见dfs.permissions属性
如果启用权限检查,就会检查所属用户权限,以确认客户端的用户名与所属用户是否匹配,另外也将检查所属组别权限,以确认该客户端是否是该用户组的成员;若不符,则检查其他权限。
这里有一个超级用户(super-user)的概念,超级用户是namenode进程的标识,对于超级用户,系统不会执行任何权限检查。
补充
POSIX(Portable Operating System Interface for Computing Systems)是由IEEE 和ISO/IEC 开发的一簇标准。该标准是基于现有的UNIX 实践和经验,描述了操作系统的调用服务接口,用于保证编制的应用程序可以在源代码一级上在多种操作系统上移植运行。