在前面我已經(jīng)分享了關(guān)于ebpf入門的文章:
基于ubuntu22.04-深入淺出 eBPF。
這篇文章介紹一個(gè)基于ebpf技術(shù)的強(qiáng)大工具--bpftrace。
在現(xiàn)代計(jì)算機(jī)系統(tǒng)中,了解系統(tǒng)的內(nèi)部運(yùn)行情況對于診斷問題、優(yōu)化性能以及進(jìn)行安全監(jiān)控至關(guān)重要。bpftrace作為一款強(qiáng)大的跟蹤工具,為開發(fā)人員和系統(tǒng)管理員提供了一種獨(dú)特的方式來監(jiān)視和分析Linux系統(tǒng)的內(nèi)部運(yùn)行。本文描述bpftrace的原理和使用。
bpftrace
「bpftrace是基于eBPF和BBC實(shí)現(xiàn)了通過探針機(jī)制采集內(nèi)核和程序運(yùn)行的信息,然后用圖表等方式將信息展示出來,幫助開發(fā)者找到隱藏較深的Bug、安全問題和性能瓶頸。」「bpftrace是一種高級跟蹤,適用于最新的Linux內(nèi)核(4.x)中提供的Linux增強(qiáng)型Berkeley數(shù)據(jù)包過濾器(eBPF)。bpftrace使用LLVM作為將腳本編譯為BPF碼字節(jié)語言,并使用BCC與Linux BPF系統(tǒng)交互,以及現(xiàn)有的Linux跟蹤功能:內(nèi)核動(dòng)態(tài)跟蹤(kprobes)、用戶級動(dòng)態(tài)跟蹤(uprobes)、和跟蹤點(diǎn)。bpftrace語言的靈感來自awk和C,以及DTrace和SystemTap等前身跟蹤」
「bpftrace通過高度抽象的封裝來使用eBPF,大多數(shù)功能只需要寥寥幾筆就可以運(yùn)行起來,可以很快讓我們搞清楚eBPF是什么樣的,而暫時(shí)不關(guān)心eBPF復(fù)雜的內(nèi)部機(jī)理。由于bpftrace深受AWK和c的影響,bpftrace使用起來于AWK非常相似,那些內(nèi)核hook注入點(diǎn)幾乎可以按普通字符串匹配來理解,非常容易上手。」
bpftrace安裝
在bpftrace的項(xiàng)目中,提供了一些常見系統(tǒng)的安裝方法,官方文檔:(https://github.com/iovisor/bpftrace/blob/master/INSTALL.md#ubuntu-packages)。支持的系統(tǒng):Ubuntu,F(xiàn)edora,Gentoo,Debian,openSUSE,CentOS,Arch,Alpine。
- 作者使用ubuntu22.04系統(tǒng),安裝過程非常簡單,步驟如下:
youyeetoo@youyeetoo:~$sudoapt-getinstall-ybpftrace
- 安裝完畢,可以確認(rèn)一下安裝情況,如果看到版本號說明安裝成功:
youyeetoo@youyeetoo:~$bpftrace-V
bpftracev0.14.0
bpftrace使用
bpftrace是eBPF的高級封裝,借助bpftrace可以一窺 eBPF 輪廓。
##列出ebpf支持的探針指令:
$bpftrace-l
##查看ebpf支持的探針個(gè)數(shù):
$bpftrace-l|wc-l
##查看不同類型ebpf探針個(gè)數(shù):
$bpftrace-l|awk-F":"'{print$1}'|sort|uniq-c
bpftrace執(zhí)行腳本
bpftrace提供了兩種不同的方式執(zhí)行腳本:
- 單行指令執(zhí)行:bpftrace -e 'cmds'
- 單行指令模式是即用即棄,執(zhí)行一些簡短的指令非常方便,所有指令都包含在最后一個(gè)參數(shù)中,需要注意的是,雖然單行指令模式的指令可能很長,但對于 bpftrace 來說,它只接受了 2 個(gè)參數(shù):-e 和 一個(gè)指令字符串(需要使用單引號包裹,確保所有指令都被識別為一個(gè)完整的字符串)。
- 單行指令,官方也提供了一些樣例,如下:
#Filesopenedbyprocess
$bpftrace-e'tracepointsys_enter_open{printf("%s%sn",comm,str(args->filename));}'
#Syscallcountbyprogram
$bpftrace-e'tracepointsys_enter{@[comm]=count();}'
#Readbytesbyprocess:
$bpftrace-e'tracepointsys_exit_read/args->ret/{@[comm]=sum(args->ret);}'
#Readsizedistributionbyprocess:
$bpftrace-e'tracepointsys_exit_read{@[comm]=hist(args->ret);}'
#Showper-secondsyscallrates:
$bpftrace-e'tracepointsys_enter{@=count();}interval1{print(@);clear(@);}'
#Tracedisksizebyprocess
$bpftrace-e'tracepointblock_rq_issue{printf("%d%s%dn",pid,comm,args->bytes);}'
#Countpagefaultsbyprocess
$bpftrace-e'software1{@[comm]=count();}'
#CountLLCcachemissesbyprocessnameandPID(usesPMCs):
$bpftrace-e'hardware1000000{@[comm,pid]=count();}'
#Profileuser-levelstacksat99Hertz,forPID189:
$bpftrace-e'profile99/pid==189/{@[ustack]=count();}'
#Filesopened,forprocessesintherootcgroup-v2
$bpftrace-e'tracepointsys_enter_openat/cgroup==cgroupid("/sys/fs/cgroup/unified/mycg")/{printf("%sn",str(args->filename));}'
- 腳本文件執(zhí)行:bpftrace
- 通過bpftrace就可以執(zhí)行c style的代碼,通過這類的代碼,bpftrace可以實(shí)現(xiàn)相對復(fù)雜的邏輯。比如通過bpftrace獲取當(dāng)前所有shell的輸入,代碼如下:
BEGIN
{
printf("Tracingbashcommands...HitCtrl-Ctoend.n");
printf("%-9st%st%st%sn","TIME","UID","PID","COMMAND");
}
uretprobe:/bin/bash:readline
{
time("%H:%M:%St");
printf("%dt%dt%sn",uid,pid,str(retval));
}
END
{
printf("end-test");
}
- 官方提供了很多工具可直接調(diào)用,鏈接:https://github.com/iovisor/bpftrace/tree/master/tools
工具 | 說明 |
---|---|
tools/bashreadline.bt | 在系統(tǒng)范圍內(nèi)打印輸入的bash命令 |
tools/biolatency.bt | 以直方圖形式顯示塊I/O延遲 |
tools/biosnoop.bt | 塊I/O跟蹤工具,顯示每個(gè)I/O延遲 |
tools/biostacks.bt | 使用初始化堆棧顯示磁盤 I/O 延遲 |
tools/bitesize.bt | 以直方圖形式顯示磁盤 I/O 大小 |
tools/capable.bt | 跟蹤安全能力檢查 |
tools/cpuwalk.bt | 采樣哪些 CPU 正在執(zhí)行進(jìn)程 |
tools/dcsnoop.bt | 跟蹤目錄條目緩存 (dcache) 查找 |
tools/execsnoop.bt | 通過 exec() 系統(tǒng)調(diào)用跟蹤新進(jìn)程 |
tools/gethostlatency.bt | 顯示 getaddrinfo/gethostbyname[2] 調(diào)用的延遲 |
tools/killsnoop.bt | 由kill()系統(tǒng)調(diào)用發(fā)出的跟蹤信號 |
tools/loads.bt | 打印負(fù)載平均值 |
tools/mdflush.bt | 跟蹤 md 刷新事件 |
tools/naptime.bt | 顯示自愿睡眠呼叫 |
tools/opensnoop.bt | 跟蹤顯示文件名的 open() 系統(tǒng)調(diào)用 |
tools/oomkill.bt | 跟蹤 OOM 殺手 |
tools/pidpersec.bt | 計(jì)算新進(jìn)程(通過 fork) |
tools/runqlat.bt | CPU 調(diào)度程序運(yùn)行隊(duì)列延遲作為直方圖 |
tools/runqlen.bt | CPU 調(diào)度程序運(yùn)行隊(duì)列長度作為直方圖 |
tools/setuids.bt | 跟蹤 setuid 系統(tǒng)調(diào)用:權(quán)限提升 |
tools/ssllatency.bt | 將 SSL/TLS 握手延遲總結(jié)為直方圖 |
tools/sslsnoop.bt | 跟蹤 SSL/TLS 握手,顯示延遲和返回值 |
tools/statsnoop.bt | 跟蹤 stat() 系統(tǒng)調(diào)用以進(jìn)行一般調(diào)試 |
tools/swapin.bt | 按進(jìn)程顯示交換 |
tools/syncsnoop.bt | 跟蹤sync()各種系統(tǒng)調(diào)用 |
tools/syscount.bt | 統(tǒng)計(jì)系統(tǒng)調(diào)用 |
tools/tcpaccept.bt | 跟蹤 TCP 被動(dòng)連接 (accept()) |
tools/tcpconnect.bt | 跟蹤 TCP 活動(dòng)連接 (connect()) |
tools/tcpdrop.bt | 跟蹤基于內(nèi)核的 TCP 數(shù)據(jù)包丟失的詳細(xì)信息 |
tools/tcplife.bt | 使用連接詳細(xì)信息跟蹤 TCP 會話生命周期 |
tools/tcpretrans.bt | 跟蹤 TCP 重傳 |
tools/ tcpsynbl.bt | 以直方圖形式顯示 TCP SYN 積壓 |
tools/threadsnoop.bt | 列出新線程創(chuàng)建 |
tools/undump.bt | 捕獲 UNIX 域套接字包 |
tools/vfscount.bt | 統(tǒng)計(jì) VFS 調(diào)用 |
tools/vfsstat.bt | 對一些 VFS 調(diào)用進(jìn)行計(jì)數(shù),并提供每秒摘要 |
tools/writeback.bt | 跟蹤文件系統(tǒng)寫回事件的詳細(xì)信息 |
tools/xfsdist.bt | 將 XFS 操作延遲分布總結(jié)為直方圖 |
審核編輯 黃宇
-
嵌入式
+關(guān)注
關(guān)注
5082文章
19104瀏覽量
304829 -
Linux
+關(guān)注
關(guān)注
87文章
11292瀏覽量
209338 -
Ubuntu
+關(guān)注
關(guān)注
5文章
563瀏覽量
29707
發(fā)布評論請先 登錄
相關(guān)推薦
評論