temu数据提取器数据提取的流程

转载

hochie 2024-06-22 14:30:50

文章标签 temu数据提取器 shell bc 标准输入云主机 文章分类 机器学习人工智能

数据提取操作

1.tr命令

方法1
方法2
方法3

2.找到 PATH 变量中的最后⼀个路径。

方法1
方法2

3. 使⽤ last 命令,输出所有的登录⽤户名及登录次数，按登录次数由多及少排序。
4. 在云主机上查找系统登录⽤户的总⼈次
5. 将 /etc/passwd 中的内容按照⽤户名排序。
6. 将 /etc/passwd 中的内容按 uid 排序。
7.将本地的 /etc ⽬录下的⽂件及⽬录，每⼗条保存到⼀个⽂件中。
8. 将 /etc/passwd 中存放的第10到20个⽤户，输出 uid ，gid 和 groups 。
9. 将按照⽤户名查看 /etc/passwd 中的⽤户，读到 'sync’ ⽤户时结束。
10. 词频统计

1.tr命令

1 2 3 4 5 6 7 9 a v 你好 . /8 求以上字符串中所有数字之和

方法1

echo -n "1 2 3 4 5 6 7 9 a v 你好 . /8" | tr -s -c 0-9 + | xargs echo | bc

1.echo -n 不打印换行
2.echo -n 不打印换行
3.tr [第一字符集] [第二字符集] 把第一字符集替换为第二字符集
4.tr -c 0-9 + 取代所有不属于第一字符集的字符（0-9之外的其他字符替换为+）
5.tr -s 将连续重复的字符以单独一个字符表示（++++替换为+）
6.xargs echo ‘|’可以将标准输出转换为标准输入，参数代换可以将管道或标准输入（stdin）数据转换成命令行参数，echo不能从标准输入读取（只能从命令行读取）
7.bc 计算，使用echo+管道，因为bc计算时需要换行符，否则不知道什么时候结束输入
bc <<< “scale=2;1/3” 保留小数点后2位

方法2

echo `echo "1 2 3 4 5 6 7 9 a v 你好 . /8" | tr -c "[0-9]" + | tr -s "+"`0 | bc

1.echo 打印自动换行，可以直接bc计算,这里管道之前的0表示其中一个加数，45+0=45
2.``表示先执行其之内的命令

方法3

echo "1 2 3 4 5 6 7 9 a v 你好 . /8" | tr -c "[0-9]" " " | tr -s " " | awk -v sum=0 '{for(i=1;i<=NF;i++) sum+=$i} END{print sum}'

1.awk -v sum=0 赋值一个用户定义变量
2.NF 代表一行有多少个域（也就是一行有多少个单词），$NF表最后一个域（也就是最后一个单词）

echo “ABCefg” >> test.log请将该⽂件中所有⼤写字母转换为⼩写

cat test.log | tr "[:upper:]" "[:lower:]" > test.log 
cat test.log | tr A-Z a-z > test.log

2.找到 PATH 变量中的最后⼀个路径。

方法1

echo ${PATH} | tr : '\n' | tail -n 1

1.tr : ‘\n’ 冒号替换为换行
2.tail -n 1 显示文件结尾最后一行的内容，等价于tail -n1

方法2

echo $PATH | rev | cut -d ":" -f1 | rev

1.echo $PATH 显示的路径是以：分隔
2.rev是反序显示
3.cut -d: -f1将反序显示的内容以：分割并且只显示第一项然后再反序显示

3. 使⽤ last 命令,输出所有的登录⽤户名及登录次数，按登录次数由多及少排序。

last | cut -d ' ' -f 1 | sort | grep -v "^$" | grep -v wtmp | uniq -c | sort -nr

1.last 输出所有的登录⽤户名及登录次数等等信息
2.cut -d ’ ’ -f 1 以空格切分，并保留第一列
3.sort 排序，这里默认是根据ASCII码升序排序 -u可以去重，但是这里没有使用，为了后边uniq -c统计
4.grep -v “^$” 反向输出（去除了空行 ^和 $分别表示句首和句尾）wtmp的一样的意思，去除wtmp的一行
5.uniq -c 进行计数
6.sort -nr 根据数值进行排序，反向排序

4. 在云主机上查找系统登录⽤户的总⼈次

last | cut -d ' ' -f 1 | sort | grep -v "^$" | grep -v wtmp | uniq -c | sort -nr | wc -l

1.这里注意wc -l的使用wc本来就是word count的含义，加了 -l表示行数，其他的用法包括-c和-w，一般使用差不多

5. 将 /etc/passwd 中的内容按照⽤户名排序。

cat /etc/passwd | sort

6. 将 /etc/passwd 中的内容按 uid 排序。

cat /etc/passwd | sort -t : -k 3 -n

1.sort -t :以：作为分隔
2.sort [-k field1[,field2]] 按指定的列进行排序，-n 依照数值的大小排序。

7.将本地的 /etc ⽬录下的⽂件及⽬录，每⼗条保存到⼀个⽂件中。

ls /etc/ | split -l 10

8. 将 /etc/passwd 中存放的第10到20个⽤户，输出 uid ，gid 和 groups 。

cat /etc/passwd | head -n 20 | tail -n 11 | cut -d : -f 1 | xargs -n 1 id

9. 将按照⽤户名查看 /etc/passwd 中的⽤户，读到 'sync’ ⽤户时结束。

cat /etc/passwd | cut -d : -f 1 | xargs -esync

1.xrags -e flag ，注意有的时候可能会是-E，flag必须是一个以空格分隔的标志，当xargs分析到含有flag这个标志的时候就停止。

10. 词频统计

⽤下⾯这个命令⽣成⼀个⽂本⽂件。 cat >> a.txt << xxx

nihao hello hello 你好
nihao
hello
ls
cd
world
pwd
xxx

cat a.txt |xargs -exxx| tr ' ' '\n' | grep -v "^$" | sort | uniq -c | sort -rn

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java stream 返回枚举类型枚举类型返回值

下一篇：求函数值在某一点的值在Python中怎么求 python求π值

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

temu数据提取器 数据提取的流程

temu数据提取器 数据提取的流程

数据提取操作

1.tr命令

方法1

方法2

方法3

2.找到 PATH 变量中的最后⼀个路径。

方法1

方法2

3. 使⽤ last 命令,输出所有的登录⽤户名及登录次数，按登录次数由多及少排序。

4. 在云主机上查找系统登录⽤户的总⼈次

5. 将 /etc/passwd 中的内容按照⽤户名排序。

6. 将 /etc/passwd 中的内容按 uid 排序。

7.将本地的 /etc ⽬录下的⽂件及⽬录，每⼗条保存到⼀个⽂件中。

8. 将 /etc/passwd 中存放的第10到20个⽤户，输出 uid ，gid 和 groups 。

9. 将按照⽤户名查看 /etc/passwd 中的⽤户，读到 'sync’ ⽤户时结束。

10. 词频统计

51CTO博客

temu数据提取器数据提取的流程

temu数据提取器数据提取的流程