文本处理工具-awk 目录 1.awk简介 2.基本用法和常用选项

1.awk简介 awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk的处理文本和数据的方式是这样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出(屏幕),如果没有指定模式,则所有被操作所指定的行都被处理。gawk是awk的GNU版本,它提供了Bell实验室和GNU的一些扩展。

2.1基本用法 awk [options] ‘program’ var=value file… awk [options] -f programfile var=value file… 2.2常用选项 -F fs fs指定输入分隔符,fs可以是字符串或正则表达式,如-F: -v var=value 赋值一个用户定义变量,将外部变量传递给awk -f scripfile 从脚本文件中读取awk命令 -m[fr] val 对val值设置内在限制,-mf选项限制分配给val的最大块数目;-mr选项限制记录的最大数目。这两个功能是Bell实验室版awk的扩展功能,在标准awk中不适用。 下面通过一个简单命令,了解下其工作原理 调用 awk时,我们指定/etc/passwd 作为输入文件。执行 awk 时,它依次对/etc/passwd 中的每一行执行 print 命令。 所有输出都发送到 stdout,所得到的结果与执行 cat /etc/passwd 完全相同。 现在,解释{ print }代码块。在 awk 中,花括号用于将几块代码组合到一起,在代码块中只有一条 print 命令。在 awk 中,如果只出现 print 命令,那么将打印当前行的全部内容。 awk 对输入文件中的每一行都执行这个脚本。