背景
perf 看不到L3cache 等硬件特性,需要更强大的工具
安装
客户端
安装GUI
服务器端
下载并安装 l_oneapi_vtune_p_2022.1.0.98_offline.sh。
安装步骤
安装下载的包
sh ./l_oneapi_vtune_p_2022.1.0.98_offline.sh
二进制位置
./oneapi/vtune/2022.1.0/bin64/vtune
安装依赖
yum group install "Development Tools"
yum install libelf-dev libelf-devel elfutils-libelf-devel
[root@qd01-test-ec2177026149 src]# cat runme.sh
cd /opt/intel/oneapi/vtune/2022.1.0/sepdk/src
./build-driver
./rmmmod-sep
./insmod-sep
[root@qd01-test-ec2177026149 src]# sh ./runme.sh
注意
如果内核有升降级,要重装driver了,drivet要和内核匹配的
使用
执行成功之后:
cd /opt/intel/oneapi/vtune/2022.1.0/bin64
抓取总的性能视图
./vtune -collect performance-snapshot
./vtune -collect performance-snapshot -target-pid 52046
抓取MMIO性能
./vtune -collect io -knob mmio=true --duration unlimited -target-pid 52046
抓取处理器架构相关的统计
#vtune -collect uarch-exploration -knob collect-memory-bandwidth=true
./vtune -collect memory-access -target-pid 52046
结果分析
你启动vtune-gui,用图形界面打开/opt/intel/oneapi/vtune/2022.1.0/bin64/r000io