过滤重复字符

[plain] view plaincopy

1. perl -e '$_=<STDIN>; @in = split; if (@in < 100){ @out = grep {! $hash{$_}++ } @in; print join "\n", @out;}'  

统计全文单词数 (同awk '{for (i=1;i<=NF;i++){a[$i]++}} END{for (b in a) print b": "a[b]}' input)
[plain] view plaincopy

1. perl -ne 'map {++$hash{$_}} (split); END{for (keys(%hash)) { print("$_: $hash{$_}\n")}}' input  

统计文本中某段中的单词数 (awk ' NR>15 && NR<17 { for (i=1;i<=NF;i++){a[$i]++} } END{for (b in a) print b": "a[b]} ' input)


判断字符串是不是ip,是则打印。
[plain] view plaincopy

1. echo "1.1.1.1" | perl -ne 'print if /\b(?:(?:(?:[01]?\d{1,2}|2[0-4]\d|25[0-5])\.){3}(?:[01]?\d{1,2}|2[0-4]\d|25[0-5]))\b/'  

统计行数 (速度最快的还是wc -l命令)
[plain] view plaincopy

1. perl -ne 'END{print $.}' file  

比较两个文件
awk 'NR==FNR{a[$0]++} NR>FNR&&!a[$0]' file1 file2   找出文件2中不同的值
awk 'NR==FNR{a[$0]++} NR>FNR&&a[$0]' file1 file2   找出两文件中相同的值替换
将所有C程序中的foo替换成bar,旧文件备份成.bak
perl -p -i.bak -e 's/\bfoo\b/bar/g' *.c很强大的功能,特别是在大程序中做重构。记得只有在UltraEdit用过。 如果你不想备份,就直接写成
perl -p -i -e或者更简单  perl -pie,恩,pie这个单词不错
将每个文件中出现的数值都加一
perl -i.bak -pe 's/(\d+)/ 1 + $1 /ge' file1 file2 ....将换行符\r\n替换成\n
perl -pie 's/\r\n/\n/g' file同dos2unix命令。
将换行符\n替换成\r\n
perl -pie 's/\n/\r\n/g' file同unix2dos命令。
取出文件的一部分
显示字段0-4和字段6,字段的分隔符是空格
perl -lane 'print "@F[0..4] $F[6]"' file很好很强大,同 awk 'print $1, $2,$3, $4, $5, $7'。参数名称lane也很好记。
如果字段分隔符不是空格而是冒号,则用
perl -F: -lane 'print "@F[0..4]\n"' /etc/passwd显示START和END之间的部分
perl -ne 'print if /^START$/ .. /^END$/' file恐怕这个操作只有sed才做得到了吧……
相反,不显示START和END之间的部分
perl -ne 'print unless /^START$/ .. /^END$/' file显示开头50行:
perl -pe 'exit if $. > 50' file同命令 head -n50
不显示开头10行:
perl -ne 'print unless 1 .. 10' file显示15行到17行: (sed -n '15,17p' file;  awk 'NR>15 && NR<17' file)
perl -ne 'print if 15 .. 17' file每行取前80个字符:
perl -lne 'print substr($_, 0, 80) = ""' file每行丢弃前10个字符:
perl -lne 'print substr($_, 10) = ""' file搜索
查找comment字符串:
perl -ne 'print if /comment/' duptext这个就是普通的grep命令了。
查找不含comment字符串的行:
perl -ne 'print unless /comment/' duptext反向的grep,即grep -v。
查找包含comment或apple的行:
perl -ne 'print if /comment/ || /apple/' duptext相同的功能就要用到egrep了,语法比较复杂,我不会……
计算
计算字段4和倒数第二字段之和:
perl -lane 'print $F[4] + $F[-2]'要是用awk,就得写成 awk '{i=NF-1;print$5+$i}'
排序和反转
文件按行排序:
perl -e 'print sort <>' file相当于简单的sort命令。
文件按段落排序:
perl -00 -e 'print sort <>' file多个文件按文件内容排序,并返回合并后的文件:
perl -0777 -e 'print sort <>' file1 file2文件按行反转:
perl -e 'print reverse <>' file1相应的命令有吗?有……不过挺偏,tac(cat的反转)
数值计算
10进制转16进制:
perl -ne 'printf "%x\n",$_'10进制转8进制: perl -ne 'printf"%o\n",$_'
16进制转10进制:
perl -ne 'print hex($_)."\n"'8进制转10进制:
perl -ne 'print oct($_)."\n"'简易计算器。
perl -ne 'print eval_r($_)."\n"'其他
启动交互式perl:
perl -de 1查看包含路径的内容:
perl -le 'print for @INC'

备注

与One-Liner相关的Perl命令行参数:

-0<数字> (用8进制表示)指定记录分隔符($/变量),默认为换行 -00 段落模式,即以连续换行为分隔符 -0777 禁用分隔符,即将整个文件作为一个记录 -a 自动分隔模式,用空格分隔$_并保存到@F中。

相当于@F = split ''。分隔符可以使用-F参数指定
-F
指定-a的分隔符,可以使用正则表达式
-e
执行指定的脚本。
-i<扩展名>
原地替换文件,并将旧文件用指定的扩展名备份。不指定扩展名则不备份。
-l
对输入内容自动chomp,对输出内容自动添加换行
-n
自动循环,相当于 while(<>) { 脚本; }
-p
自动循环+自动输出,相当于 while(<>) { 脚本;print; }