linux GPU 记录日志

转载

mob64ca13fdd43c 2024-07-06 14:30:11

文章标签 linux GPU 记录日志 Linux命令常用命令搜索重定向 文章分类 游戏开发

今天线上生产环境出了问题，于是通过用Linux命令查看日志得方法来解决问题，最终找到根源，这里查看日志等命令还是比较简单，稍微深入学习下 Linux。接上一篇。。

CPU

top：查看每个进程的情况

在top模式下，输入1：查看每个CPU的性能数据，注意观察是否有CPU100%占用率

CPU参数含义：

1）us过高表示Java应用程序消耗了大量CPU，需要定位是哪一个线程，并分析线程堆栈。

在top模式下，输入H：查看每个线程的性能信息
如果某个线程CPU利用率一直100%，则说明这个线程可能有死循环，也有可能是GC的问题。jstat命令可以查看GC情况，是不是产生了FullGC。

2）sy过高表示花费了更多时间进行线程切换。同样需要查看Java线程的状态。

文件IO 磁盘

ls
显示文件夹下的文件详情，包括大小
ls –all
a表示all，包括隐藏文件

stat（查看文件详情）
stat filepath

文本操作命令

cat 由第一行开始显示内容，并将所有内容输出
tac 从最后一行倒序显示内容，并将所有内容输出
more 根据窗口大小，一页一页的显示文件内容
less 和more类似，但其优点可以往前翻页，而且进行可以搜索字符
head 只显示头几行
tail 只显示最后几行
sort、uniq
sort 进行排序。

$ sort [-fbMnrtuk] [file or stdin]
-f ：忽略大小写
-b ：忽略最前面的空格
-M ：以月份的名字来排序，例如 JAN, DEC
-n ：使用数字
-r ：反向排序
-u ：相当于 unique ，重复内容只出现一次
-t ：分隔符，默认为tab
-k ：指定排序的区间
范例：/etc/passwd 内容是以 : 来分隔的，以第三栏来排序。

$ cat /etc/passwd | sort -t ':' -k 3
root:x:0:0:root:/root:/bin/bash
dmtsai:x:1000:1000:dmtsai:/home/dmtsai:/bin/bash
alex:x:1001:1002::/home/alex:/bin/bash
arod:x:1002:1003::/home/arod:/bin/bash
uniq 可以将重复的数据只取一个。

$ uniq [-ic]
-i ：忽略大小写
-c ：进行计数

使用cat命令可以显示文本文件内容,或把几个文件内容附加到另一个文件中。
使用more命令可以分页显示文本文件的内容。
使用less命令可以回卷显示文本文件的内容。
使用head命令可以显示指定文件的前若干行文件内容。
使用tail命令可以查看文件的末尾数据。

vim

vi编辑器有3种基本工作模式,分别是命令行模式、插入模式和末行模式。
命令行模式控制屏幕光标的移动,字符、字或行的删除,移动、复制某区域及进入插入模式,或者到末行模式。
只有在插入模式下,才可以做文字输入,按“Esc”键可回到命令行模式。
末行模式将文件保存或退出vi编辑器,也可以设置编辑环境,如寻找字符串、列出行号等。

在指令列模式下，有以下命令用于离开或者存储文件。

命令作用
:w 写入磁盘
:w! 当文件为只读时，强制写入磁盘。到底能不能写入，与用户对该文件的权限有关
:q 离开
:q! 强制离开不保存
:wq 写入磁盘后离开
:wq! 强制写入磁盘后离开

实时查看日志命令

这个算是最近用的比较多得一条命令了。。。
tail -f path
-f 循环读取

系统日志

/var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一
/var/log/secure 与安全相关的日志信息
/var/log/maillog 与邮件相关的日志信息
/var/log/cron 与定时任务相关的日志信息
/var/log/spooler 与UUCP和news设备相关的日志信息
/var/log/boot.log 守护进程启动和停止相关的日志消息
/var/log/wtmp 该日志文件永久记录每个用户登录、注销及系统的启动、停机的事件

find

查找磁盘上最大的文件的命令
find / -type f -size +10G
列出当前目录及子目录下所有文件和文件夹

在/home目录下查找以.txt结尾的文件名 find /home -name “*.txt”

同上，但忽略大小写 find /home -iname “*.txt”

根据文件类型进行搜索find . -type 类型参数:
类型参数列表：
f 普通文件
l 符号连接
d 目录
c 字符设备
b 块设备
s 套接字
p Fifo

基于目录深度搜索:
向下最大深度限制为3 find . -maxdepth 3 -type f
搜索出深度距离当前目录至少2个子目录的所有文件 find . -mindepth 2 -type f
根据文件时间戳进行搜索 find . -type f 时间戳

UNIX/Linux文件系统每个文件都有三种时间戳：

访问时间（-atime/天，-amin/分钟）：用户最近一次访问时间。
修改时间（-mtime/天，-mmin/分钟）：文件最后一次修改时间。
变化时间（-ctime/天，-cmin/分钟）：文件数据元（例如权限等）最后一次修改时间。
搜索最近七天内被访问过的所有文件

find . -type f -atime -7 搜索恰好在七天前被访问过的所有文件

find . -type f -atime 7 搜索超过七天内被访问过的所有文件

find . -type f -atime +7 搜索访问时间超过10分钟的所有文件

find . -type f -amin +10 找出比file.log修改时间更长的所有文件

find . -type f -newer file.log 根据文件大小进行匹配
find . -type f -size 文件大小单元文件大小单元：

b —— 块（512字节）
c —— 字节
w —— 字（2字节）
k —— 千字节
M —— 兆字节
G —— 吉字节
搜索大于10KB的文件find . -type f -size +10k
搜索小于10KB的文件find . -type f -size -10k
搜索等于10KB的文件find . -type f -size 10k

删除匹配文件
删除当前目录下所有.txt文件 find . -type f -name “.txt" -delete
根据文件权限/所有权进行匹配
当前目录下搜索出权限为777的文件 find . -type f -perm 777
找出当前目录下权限不是644的php文件 find . -type f -name ".php” ! -perm 644
找出当前目录用户tom拥有的所有文件 find . -type f -user tom

将当前目录下所有以“.txt”结尾的文件打印出来，再追问，除了“.txt”再加上“.abc”结尾的也打印出来。
find . -name “*.txt”

grep

在文件内查找字符串
grep “字符串” filename
文件权限
r：可读(4)
w：可写(2)，对于目录来说表示可在目录中新建文件
x：可执行(1)，对于目录来说为可进入到该目录中
-：表示无对应位上的权限
4代表读权限，2代表写权限，1代表执行权限

7=4+2+1,表示拥有可读可写可执行权限
5=4+1,表示拥有可读可执行权限，但是没有写权限
4 代表拥有可读权限
0 代表没有任何权限

chmod 修改文件属性

chmod 777 /home/berry
chmod u+x /home/berry

u 表示“用户（user）”，即文件或目录的所有者。
g 表示“同组（group）用户”，即与文件属主有相同组ID的所有用户。
o 表示“其他（others）用户”。
a 表示“所有（all）用户”。它是系统默认值。

chown 修改文件的属主与属组

chown guest:guest a.txt
chown -R guest /home/berry (把berry文件下的所有文件都改成guest这个组）
chgrp 修改文件的所属的用户组
chgrp -R guest /var/tmp/f.txt
chgrp - R root /home/berry/file/a.txt
iostat（查看各个设备的IO状态，查看磁盘读写性能）
直接输入iostat：
tps是每秒的IO请求数，这是IO消耗情况值得关注的数字。
Blk_read/s是指每秒读取的块数量，通过块的大小是512字节
Blk_read是指总共读取的块数量

进程

ps –ef/-aux
ps aux 和ps -ef
两者的输出结果差别不大，但展示风格不同。aux是BSD风格，-ef是System V风格。这是次要的区别，一个影响使用的区别是aux会截断command列，而-ef不会。当结合grep时这种区别会影响到结果。

ps -ef 显示出的结果：
1.UID 用户ID
2.PID 进程ID
3.PPID 父进程ID
4.C CPU占用率
5.STIME 开始时间
6.TTY 开始此进程的TTY----终端设备
7.TIME 此进程运行的总时间
8.CMD 命令名
lsof 进程打开的文件、端口
lsof ［options］ filename
-a：列出打开文件存在的进程；
-c<进程名>：列出指定进程所打开的文件；
-g：列出GID号进程详情；
-d<文件号>：列出占用该文件号的进程；
+d<目录>：列出目录下被打开的文件；
+D<目录>：递归列出目录下被打开的文件；
-n<目录>：列出使用NFS的文件；
-i<条件>：列出符合条件的进程。（4、6、协议、:端口、 @ip ）
-p<进程号>：列出指定进程号所打开的文件；
-u：列出UID号进程详情；
-h：显示帮助信息；
-v：显示版本信息。

cwd：表示current work dirctory，即：应用程序的当前工作目录，这是该应用程序启动的目录，除非它本身对这个目录进行更改
txt：该类型的文件是程序代码，如应用程序二进制文件本身或共享库，如上列表中显示的 /sbin/init 程序
lnn：library references (AIX);
er：FD information error (see NAME column);
jld：jail directory (FreeBSD);
ltx：shared library text (code and data);
mxx ：hex memory-mapped type number xx.
m86：DOS Merge mapped file;
mem：memory-mapped file;
mmap：memory-mapped device;
pd：parent directory;
rtd：root directory;
tr：kernel trace file (OpenBSD);
v86 VP/ix mapped file;
0：表示标准输出
1：表示标准输入
2：表示标准错误

kill

杀死进程

负载 Load Average
系统的load被定义为特定时间间隔内运行队列的平均线程数，如果一个线程满足以下条件，该线程就会处于运行队列中：

没有处于I/O等待状态。
没有主动进入等待状态，也就是没有调用wait操作；
没有被终止。

每个CPU的核都维护了一个运行队列，系统的load主要由运行队列来决定。load的值越大，也就意味着系统的CPU越繁忙，这样线程运行完以后等待操作系统分配下一个时间片段的时间也就越长。一般来说，只要每个CPU当前的活动线程数不大于3，我们认为它的负载是正常的，如果每个CPU的线程数大于5，则表示当前系统的负载已经非常高了，需要采取措施来减低系统的负载，以提高响应速度。

使用top命令查看，该值是三个浮点数，表示最近1分钟、5分钟、15分钟的运行队列平均进程数。

cp/mv的区别

1、功能上的区别
mv：用户可以使用该命令为文件或目录重命名或将文件由一个目录移入另一个目录中。
cp: 该命令的功能是将给出的文件或目录拷贝到另一文件或目录中。

2、从inode角度来区分
mv：会将存储于indoe索引节点上的文件元信息也移动到新文件中。
cp : 只会复制文件数据，不会复制inode索引节点上的文件元信息。

cp 的时候是真正意义上的内容copy，对于 inode 节点却是不会变化的。
mv 的时候是把源文件直接删除了（inode 删除了），新的文件其实已经不是以前的文件了，只是名字一样而已。
网络

netstat（端口）

查看tcp连接数状态
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’
统计8080端口上有多少个TCP连接，命令：
netstat –nat | grep 8080 | wc –l
TCP连接中有多少个连接状态是ESTABLISHED，命令：
netstat –nat | grep 8080 | grep ESTABLISHED| wc -l
TCP连接中有多少个连接状态是CLOSE_WAIT
netstat –nat | grep 8080 | grep CLOSE_WAIT| wc -l
TCP连接中有多少个连接状态是TIME_WAIT
netstat –nat | grep 8080 | grep TIME_WAIT| wc -l
使用awk来完成统计信息，命令如下
netstat –nat | grep 8080 | awk ‘{++S[$NF]} END {for (a in S) print a, S[a]}’
sar
sar –n FULL 1 2 执行后以1s为频率，总共输出两次网络IO的消耗情况。
输出信息包含三部分：网卡上成功的接包和发包的信息网卡上失败的接包和发包信息 sockets上的统计信息（tcpsck、udpsck）
如需详细跟踪tcp/ip通信过程的信息，则可通过tcpdump来进行。

tcpdump

tcpdump [ -DenNqvX ] [ -c count ] [ -F file ] [ -i interface ] [ -r file ]
[ -s snaplen ] [ -w file ] [ expression ]

抓包选项：
-c：指定要抓取的包数量。注意，是最终要获取这么多个包。例如，指定"-c 10"将获取10个包，但可能已经处理了100个包，只不过只有10个包是满足条件的包。
-i interface：指定tcpdump需要监听的端口。若未指定该选项，将从系统接口列表中搜寻编号最小的已配置好的接口(不包括loopback端口，要抓取loopback接口使用tcpdump -i lo)，
：一旦找到第一个符合条件的端口，搜寻马上结束。可以使用’any’关键字表示所有网络接口。
-n：对地址以数字方式显式，否则显式为主机名，也就是说-n选项不做主机名解析。
-nn：除了-n的作用外，还把端口显示为数值，否则显示端口服务名。
-N：不打印出host的域名部分。例如tcpdump将会打印’nic’而不是’nic.ddn.mil’。
-P：指定要抓取的包是流入还是流出的包。可以给定的值为"in"、“out"和"inout”，默认为"inout"。
-s len：设置tcpdump的数据包抓取长度为len，如果不设置默认将会是65535字节。对于要抓取的数据包较大时，长度设置不够可能会产生包截断，若出现包截断，

输出选项：
-e：输出的每行中都将包括数据链路层头部信息，例如源MAC和目标MAC。
-q：快速打印输出。即打印很少的协议相关信息，从而输出行都比较简短。
-X：输出包的头部数据，会以16进制和ASCII两种方式同时输出。
-XX：输出包的头部数据，会以16进制和ASCII两种方式同时输出，更详细。
-v：当分析和打印的时候，产生详细的输出。
-vv：产生比-v更详细的输出。
-vvv：产生比-vv更详细的输出。

其他功能性选项：
-D：列出可用于抓包的接口。将会列出接口的数值编号和接口名，它们都可以用于"-i"后。
-F：从文件中读取抓包的表达式。若使用该选项，则命令行中给定的其他表达式都将失效。
-w：将抓包数据输出到文件中而不是标准输出。可以同时配合"-G time"选项使得输出文件每time秒就自动切换到另一个文件。可通过"-r"选项载入这些文件以进行分析和打印。
-r：从给定的数据包文件中读取数据。使用"-"表示从标准输入中读取。

(1).默认启动
tcpdump
默认情况下，直接启动tcpdump将监视第一个网络接口(非lo口)上所有流通的数据包。这样抓取的结果会非常多，滚动非常快。

(2).监视指定网络接口的数据包
tcpdump -i eth1
如果不指定网卡，默认tcpdump只会监视第一个网络接口，如eth0。

(3).监视指定主机的数据包，例如所有进入或离开longshuai的数据包
tcpdump host longshuai

(4).打印helios<–>hot或helios<–>ace之间通信的数据包
tcpdump host helios and ( hot or ace )

(5).打印ace与任何其他主机之间通信的IP数据包,但不包括与helios之间的数据包
tcpdump ip host ace and not helios

(6).截获主机hostname发送的所有数据
tcpdump src host hostname
(7).监视所有发送到主机hostname的数据包
tcpdump dst host hostname

(8).监视指定主机和端口的数据包
tcpdump tcp port 22 and host hostname

(9).对本机的udp 123端口进行监视(123为ntp的服务端口)
tcpdump udp port 123

(10).监视指定网络的数据包，如本机与192.168网段通信的数据包，"-c 10"表示只抓取10个包
tcpdump -c 10 net 192.168

AWK/SED

awk
awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。
awk ‘{pattern + action}’ {filenames}

统计ip
cat test.txt | awk ‘{print $2}’ | sort | uniq -c | sort -n -r | head -n 1
sed 编辑文本
sed -e ‘s/foo/bar/’ myfile
将 myfile 文件中每行第一次出现的foo用字符串bar替换，然后将该文件内容输出到标准输出

sed -e ‘s/foo/bar/g’ myfile

g 使得 sed 对文件中所有符合的字符串都被替换

sed -i ‘s/foo/bar/g’ myfile
选项 i 使得 sed 修改文件

sed -i ‘s/foo/bar/g’ ./m*
批量操作当前目录下以 m 开头的文件

sed -i ‘s/foo/bar/g’ grep foo -rl --include="m*" ./

``括起来的grep命令，表示将grep命令的的结果作为操作文件
grep 命令中，选项r表示查找所有子目录，l表示仅列出符合条件的文件名，用来传给sed命令做操作，–include=“m*” 表示仅查找 m 开头的文件
管道
管道是linux提供的一种常见的进程通信工具
管道中的数据只能读取一次
管道的实现并没有使用专门的数据结构，而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点，而这个 VFS 索引节点又指向一个物理页面而实现的。

其他

关机

数据同步写入磁盘 sync

为了加快对磁盘上文件的读写速度，位于内存中的文件数据不会立即同步到磁盘上，因此关机之前需要先进行 sync 同步操作。

shutdown

/sbin/shutdown [-krhc] [时间] [警告讯息]
-k ：不会关机，只是发送警告讯息，通知所有在线的用户
-r ：将系统的服务停掉后就重新启动
-h ：将系统的服务停掉后就立即关机
-c ：取消已经在进行的 shutdown 指令内容
3. 其它关机指令
reboot、halt、poweroff。
运行等级
0：关机模式 1：单用户模式（可用于破解root密码） 2：无网络支持的多用户模式 3：有网络支持的多用户模式（文本模式，工作中最常用的模式） 4：保留，未使用 5：有网络支持的 X-windows 支持多用户模式（桌面） 6：重新引导系统，即重启
BIOS
BIOS 是开机的时候计算机执行的第一个程序，这个程序知道可以开机的磁盘，并读取磁盘第一个扇区的 MBR，由 MBR 执行其中的开机管理程序，这个开机管理程序的会加载操作系统的核心文件。

MBR 中的开机管理程序提供以下功能：选单、载入核心文件以及转交其它开机管理程序。转交这个功能可以用来实现了多重引导，只需要将另一个操作系统的开机管理程序安装其它分区的启动扇区上，在启动 MBR 中的开机管理程序时，就可以选择启动当前的操作系统或者转交给其它开机管理程序从而启动另一个操作系统。

指令搜索顺序

以绝对或相对路径来执行指令，例如 /bin/ls 或者 ./ls ；
由别名找到该指令来执行；
由 Bash 内建的指令来执行；
按 $PATH 变量指定的搜索路径的顺序找到第一个指令来执行。
数据流重定向
重定向有5种方式，分别是: 输出重定向、输入重定向、错误重定向、追加重定向以及同时实现输出和错误的重定向。

重定向就是使用文件代替标准输入、标准输出和标准错误输出。

标准输入 (stdin) ：代码为 0 ，使用 < 或 << ；
标准输出 (stdout) ：代码为 1 ，使用 > 或 >> ；
标准错误输出(stderr)：代码为 2 ，使用 2> 或 2>> ；
其中，有一个箭头的表示以覆盖的方式重定向，而有两个箭头的表示以追加的方式重定向。

可以将不需要的标准输出以及标准错误输出重定向到 /dev/null ，相当于扔进垃圾箱。

如果需要将标准输出以及标准错误输出同时重定向到一个文件，需要将某个输出转换为另一个输出，例如 2>&1 表示将标准错误输出转换为标准输出。