strace是一個可用于診斷、調(diào)試和分析的Linux用戶空間跟蹤器。我們用它來監(jiān)控用戶空間進程和內(nèi)核的交互,比如系統(tǒng)調(diào)用、信號傳遞、進程狀態(tài)變更等。
在日常運維中,strace作為一種動態(tài)跟蹤工具,能夠幫助運維高效地定位進程和服務(wù)故障。可以使用strace分析程序hang住或者程序崩潰的原因,其跟蹤程序執(zhí)行過程中產(chǎn)生的系統(tǒng)調(diào)用及接收到的信號,幫助我們分析程序或命令執(zhí)行中遇到的異常情況,使用strace跟蹤掛死程序,如果最后一行系統(tǒng)調(diào)用顯示完整,程序在邏輯代碼處掛死;如果最后一行系統(tǒng)調(diào)用顯示不完整,程序在該系統(tǒng)調(diào)用處掛死。
-c 統(tǒng)計每一系統(tǒng)調(diào)用的所執(zhí)行的時間,次數(shù)和出錯的次數(shù)等. -d 輸出strace關(guān)于標準錯誤的調(diào)試信息. -f 跟蹤由fork調(diào)用所產(chǎn)生的子進程. -ff 如果提供-ofilename,則所有進程的跟蹤結(jié)果輸出到相應(yīng)的filename.pid中,pid是各進程的進程號. -F 嘗試跟蹤vfork調(diào)用.在-f時,vfork不被跟蹤. -h 輸出簡要的幫助信息. -i 輸出系統(tǒng)調(diào)用的入口指針. -q 禁止輸出關(guān)于脫離的消息. -r 打印出相對時間關(guān)于,,每一個系統(tǒng)調(diào)用. -t 在輸出中的每一行前加上時間信息. -tt 在輸出中的每一行前加上時間信息,微秒級. -ttt 微秒級輸出,以秒了表示時間. -T 顯示每一調(diào)用所耗的時間. -v 輸出所有的系統(tǒng)調(diào)用.一些調(diào)用關(guān)于環(huán)境變量,狀態(tài),輸入輸出等調(diào)用由于使用頻繁,默認不輸出. -V 輸出strace的版本信息. -x 以十六進制形式輸出非標準字符串 -xx 所有字符串以十六進制形式輸出. -a column 設(shè)置返回值的輸出位置.默認為40. -e expr 指定一個表達式,用來控制如何跟蹤.格式如下: [qualifier=][!]value1[,value2]... qualifier只能是trace,abbrev,verbose,raw,signal,read,write其中之一.value是用來限定的符號或數(shù)字.默認的qualifier是trace.感嘆號是否定符號.例如: -eopen等價于 -etrace=open,表示只跟蹤open調(diào)用.而-etrace!=open表示跟蹤除了open以外的其他調(diào)用.有兩個特殊的符號all 和none. 注意有些shell使用!來執(zhí)行歷史記錄里的命令,所以要使用. -e trace=set 只跟蹤指定的系統(tǒng)調(diào)用.例如:-etrace=open,close,rean,write表示只跟蹤這四個系統(tǒng)調(diào)用.默認的為set=all. -e trace=file 只跟蹤有關(guān)文件操作的系統(tǒng)調(diào)用. -e trace=process 只跟蹤有關(guān)進程控制的系統(tǒng)調(diào)用. -e trace=network 跟蹤與網(wǎng)絡(luò)有關(guān)的所有系統(tǒng)調(diào)用. -e strace=signal 跟蹤所有與系統(tǒng)信號有關(guān)的系統(tǒng)調(diào)用 -e trace=ipc 跟蹤所有與進程通訊有關(guān)的系統(tǒng)調(diào)用 -e abbrev=set 設(shè)定strace輸出的系統(tǒng)調(diào)用的結(jié)果集.-v等與abbrev=none.默認為abbrev=all. -e raw=set 將指 定的系統(tǒng)調(diào)用的參數(shù)以十六進制顯示. -e signal=set 指定跟蹤的系統(tǒng)信號.默認為all.如signal=!SIGIO(或者signal=!io),表示不跟蹤SIGIO信號. -e read=set 輸出從指定文件中讀出的數(shù)據(jù).例如: -e read=3,5 -e write=set 輸出寫入到指定文件中的數(shù)據(jù). -o filename 將strace的輸出寫入文件filename -p pid 跟蹤指定的進程pid. -s strsize 指定輸出的字符串的最大長度.默認為32.文件名一直全部輸出. -u username 以username的UID和GID執(zhí)行被跟蹤的命令 |
通用的完整用法:
strace -o output.txt -T -tt -e trace=all -p 29626 |
上面的含義是跟蹤29626進程的所有系統(tǒng)調(diào)用(-etrace=all),并統(tǒng)計系統(tǒng)調(diào)用的花費時間,以及開始時間(并以可視化的時分秒格式顯示),最后將記錄結(jié)果存在output.txt文件里面。
在給新主機10.230.19.132/133及數(shù)據(jù)庫添加MEM監(jiān)控時,需要先在主機上安裝agent,在132執(zhí)行./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin時一直卡住不動,既沒有報錯也沒有彈出如下的選擇命令:
Language Selection Please select the installation language [1] English - English [2] Japanese - 日本語 Please choose an option [1] : |
[mysql@onlinec]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/132.log 2>&1 |
futex(0x39dbf923c4, FUTEX_WAKE_PRIVATE,2147483647) = 0 open("/etc/resolv.conf", O_RDONLY) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=94, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "# Generated byNetworkManager na"..., 4096) = 94 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 open("/etc/hosts", O_RDONLY|O_CLOEXEC) = 7 fstat(7, {st_mode=S_IFREG|0644, st_size=187, ...})= 0 mmap(NULL, 4096, PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f4697c5f000 read(7, "27.0.0.1 localhost.localdomai"..., 4096) = 187 read(7, "", 4096) = 0 close(7) = 0 munmap(0x7f4697c5f000, 4096) = 0 socket(PF_INET, SOCK_STREAM|SOCK_CLOEXEC,IPPROTO_TCP) = 7 setsockopt(7, SOL_TCP, TCP_NODELAY, [1], 4) = 0 setsockopt(7, SOL_SOCKET, SO_KEEPALIVE, [1], 4) =0 connect(7, {sa_family=AF_INET,sin_port=htons(6010), sin_addr=inet_addr("27.0.0.1")}, 16 |
[mysql@onlinecs_m]#strace./mysqlmonitoragent-3.3.3.1199-linux-x86-64bit-installer.bin >/tmp/133.log 2>&1 |
poll([{fd=7, events=POLLIN|POLLOUT}], 1, 5000) = 1([{fd=7, revents=POLLOUT}]) sendto(7,"K3571 |