使用 GDB 調試 Linux 軟體

來源:互聯網
上載者:User

編譯

開始調試之前,必須用程式中的調試資訊編譯要調試的程式。這樣,gdb 才能夠調試所使用的變數、程式碼和函數。如果要進行編譯,請在 gcc(或 g++)下使用額外的 '-g' 選項來編譯器:

gcc -g eg.c -o eg
 
運行 gdb

在 shell 中,可以使用 'gdb' 命令並指定程式名作為參數來運行 gdb,例如 'gdb eg';或者在 gdb 中,可以使用 file 命令來裝入要調試的程式,例如 'file eg'。這兩種方式都假設您是在包含程式的目錄中執行命令。裝入程式之後,可以用 gdb 命令 'run' 來啟動程式。

 

偵錯工作階段樣本

如果一切正常,程式將執行到結束,此時 gdb 將重新獲得控制。但如果有錯誤將會怎麼樣?這種情況下,gdb 會獲得控制並中斷程式,從而可以讓您檢查所有事物的狀態,如果運氣好的話,可以找出原因。為了引發這種情況,我們將使用一個 樣本程式:

程式碼範例 eg1.c

#include int wib(int no1, int no2){  int result, diff;  diff = no1 - no2;  result = no1 / diff;  return result;}int main(int argc, char *argv[]){  int value, div, result, i, total;  value = 10;  div = 6;  total = 0;  for(i = 0; i < 10; i++)  {    result = wib(value, div);    total += result;    div++;    value--;  }  printf("%d wibed by %d equals %d\n", value, div, total);  return 0;}

這個程式將運行 10 次 for 迴圈,使用 'wib()" Function Compute出累積值,最後列印出結果。

在您喜歡的文字編輯器中輸入這個程式(要保持相同的行距),儲存為 'eg1.c',使用 'gcc -g eg1.c -o eg1' 進行編譯,並用 'gdb eg1' 啟動 gdb。使用 'run' 運行程式可能會產生以下訊息:

 
Program received signal SIGFPE, Arithmetic exception.0x80483ea in wib (no1=8, no2=8) at eg1.c:77         result = no1 / diff;(gdb)

gdb 指出在程式第 7 行發生一個算術異常,通常它會列印這一行以及 wib() 函數的自變數值。要查看第 7 行前後的原始碼,請使用 'list' 命令,它通常會列印 10 行。再次輸入 'list'(或者按斷行符號重複上一條命令)將列出程式的下 10 行。從 gdb 訊息中可以看出,第 7 行中的除法運算出了錯,程式在這一行中將變數 "no1" 除以 "diff"。

要查看變數的值,使用 gdb 'print' 命令並指定變數名。輸入 'print no1' 和 'print diff',可以相應看到 "no1" 和 "diff" 的值,結果如下:

 
(gdb) print no1$5 = 8(gdb) print diff$2 = 0

gdb 指出 "no1" 等於 8,"diff" 等於 0。根據這些值和第 7 行中的語句,我們可以推斷出算術異常是由除數為 0 的除法運算造成的。清單顯示了第 6 行計算的變數 "diff",我們可以列印 "diff" 運算式(使用 'print no1 - no2' 命令),來重新估計這個變數。gdb 告訴我們 wib 函數的這兩個自變數都等於 8,於是我們要檢查調用 wib() 函數的 main() 函數,以查看這是在什麼時候發生的。在允許程式自然終止的同時,我們使用 'continue' 命令告訴 gdb 繼續執行。

 
(gdb) continueContinuing.Program terminated with signal SIGFPE, Arithmetic exception.The program no longer exists.

使用斷點

為了查看在 main() 中發生了什麼情況,可以在程式碼中的某一特定行或函數中設定斷點,這樣 gdb 會在遇到斷點時中斷執行。可以使用命令 'break main' 在進入 main() 函數時設定斷點,或者可以指定其它任何感興趣的函數名來設定斷點。然而,我們只希望在調用 wib() 函數之前中斷執行。輸入 'list main' 將列印從 main() 函數開始的源碼清單,再次按斷行符號將顯示第 21 行上的 wib() 函數調用。要在那一行上設定斷點,只需輸入 'break 21'。gdb 將發出以下響應:

 
(gdb) break 21Breakpoint 1 at 0x8048428: file eg1.c, line 21.

以顯示它已在我們請求的行上設定了 1 號斷點。'run' 命令將從頭重新運行程式,直到 gdb 中斷為止。發生這種情況時,gdb 會產生一條訊息,指出它在哪個斷點上中斷,以及程式運行到何處:

 
Breakpoint 1, main (argc=1, argv=0xbffff954) at eg1.c:2121          result = wib(value, div);

發出 'print value' 和 'print div' 將會顯示在第一次調用 wib() 時,變數分別等於 10 和 6,而 'print i' 將會顯示 0。幸好,gdb 將顯示所有局部變數的值,並使用 'info locals' 命令儲存大量輸入資訊。

從以上的調查中可以看出,當 "value" 和 "div" 相等時就會出現問題,因此輸入 'continue' 繼續執行,直到下一次遇到 1 號斷點。對於這次迭代,'info locals' 顯示了 value=9 和 div=7。

與其再次繼續,還不如使用 'next' 命令單步偵錯工具,以查看 "value" 和 "div" 是如何改變的。gdb 將響應:

 
(gdb) next22          total += result;

再按兩次斷行符號將顯示加法和減法運算式:

 
(gdb)23          div++;(gdb)24          value--;

再按兩次斷行符號將顯示第 21 行,wib() 調用。'info locals' 將顯示目前 "div" 等於 "value",這就意味著將發生問題。如果有興趣,可以使用 'step' 命令(與 'next' 形成對比,'next' 將跳過函數調用)來繼續執行 wib() 函數,以再次查看除法錯誤,然後使用 'next' 來計算 "result"。

現在已完成了調試,可以使用 'quit' 命令退出 gdb。由於程式仍在運行,這個操作會終止它,gdb 將提示您確認。

 

更多斷點和觀察點

由於我們想要知道在調用 wib() 函數之前 "value" 什麼時候等於 "div",因此在上一樣本中我們在第 21 行中設定斷點。我們必須繼續執行兩次程式才會發生這種情況,但是只要在斷點上設定一個條件就可以使 gdb 只在 "value" 與 "div" 真正相等時暫停。要設定條件,可以在定義斷點時指定 "break <line number> if <conditional expression>"。將 eg1 再次裝入 gdb,並輸入:

 
(gdb) break 21 if value==divBreakpoint 1 at 0x8048428: file eg1.c, line 21.

如果已經在第 21 行中設定了斷點,如 1 號斷點,則可以使用 'condition' 命令來代替在斷點上設定條件:

 
(gdb) condition 1 value==div

使用 'run' 運行 eg1.c 時,如果 "value" 等於 "div",gdb 將中斷,從而避免了在它們相等之前必須手工執行 'continue'。調試 C 程式時,斷點條件可以是任何有效 C 運算式,一定要是程式所使用語言的任意有效運算式。條件中指定的變數必須在設定了斷點的行中,否則運算式就沒有什麼意義!

使用 'condition' 命令時,如果指定斷點編號但又不指定運算式,可以將斷點設定成無條件斷點,例如,'condition 1' 就將 1 號斷點設定成無條件斷點。

要查看當前定義了什麼斷點及其條件,請發出命令 'info break':

 
(gdb) info breakNum Type           Disp Enb Address    What1   breakpoint     keep y   0x08048428 in main at eg1.c:21        stop only if value == div        breakpoint already hit 1 time

除了所有條件和已經遇到斷點多少次之外,斷點資訊還在 'Enb' 列中指定了是否啟用該斷點。可以使用命令 'disable <breakpoint number>'、'enable <breakpoint number>' 或 'delete <breakpoint number>' 來禁用、啟用和徹底刪除斷點,例如 'disable 1' 將阻止在 1 號斷點處中斷。

如果我們對 "value" 什麼時候變得與 "div" 相等更感興趣,那麼可以使用另一種斷點,稱作監視。當指定運算式的值改變時,監視點將中斷程式執行,但必須在運算式中所使用的變數在範圍中時設定監視點。要擷取範圍中的 "value" 和 "div",可以在 main 函數上設定斷點,然後運行程式,當遇到 main() 斷點時設定監視點。重新啟動 gdb,並裝入 eg1,然後輸入:

 
(gdb) break mainBreakpoint 1 at 0x8048402: file eg1.c, line 15.(gdb) run...Breakpoint 1, main (argc=1, argv=0xbffff954) at eg1.c:1515        value = 10;

要瞭解 "div" 何時更改,可以使用 'watch div',但由於要在 "div" 等於 "value" 時中斷,那麼應輸入:

 
(gdb) watch div==valueHardware watchpoint 2: div == value

如果繼續執行,那麼當運算式 "div==value" 的值從 0(假)變成 1(真)時,gdb 將中斷:

 
(gdb) continueContinuing.Hardware watchpoint 2: div == valueOld value = 0New value = 1main (argc=1, argv=0xbffff954) at eg1.c:1919        for(i = 0; i < 10; i++)

'info locals' 命令將驗證 "value" 是否確實等於 "div"(再次聲明,是 8)。

'info watch' 命令將列出已定義的監視點和斷點(此命令等價於 'info break'),而且可以使用與斷點相同的文法來啟用、禁用和刪除監視點。

 

core 檔案

在 gdb 下運行程式可以使俘獲錯誤變得更容易,但在調試器外啟動並執行程式通常會中止而只留下一個 core 檔案。gdb 可以裝入 core 檔案,並讓您檢查程式中止之前的狀態。

在 gdb 外運行樣本程式 eg1 將會導致核心資訊轉儲:

 
$ ./eg1Floating point exception (core dumped)
 

要使用 core 檔案啟動 gdb,在 shell 中發出命令 'gdb eg1 core' 或 'gdb eg1 -c core'。gdb 將裝入 core 檔案,eg1 的程式清單,顯示程式是如何終止的,並顯示非常類似於我們剛才在 gdb 下運行程式時看到的訊息:

 
...Core was generated by `./eg1'.Program terminated with signal 8, Floating point exception....#0  0x80483ea in wib (no1=8, no2=8) at eg1.c:77         result = no1 / diff;

此時,可以發出 'info locals'、'print'、'info args' 和 'list' 命令來查看引起除數為零的值。'info variables' 命令將列印出所有程式變數的值,但這要進行很長時間,因為 gdb 將列印 C 庫和程式碼中的變數。為了更容易地查明在調用 wib() 的函數中發生了什麼情況,可以使用 gdb 的堆棧命令。

 

堆疊追蹤

程式“呼叫堆疊”是當前函數之前的所有已調用函數的列表(包括當前函數)。每個函數及其變數都被分配了一個“幀”,最近調用的函數在 0 號幀中(“底部”幀)。要列印堆棧,發出命令 'bt'('backtrace' [回溯] 的縮寫):

 
(gdb) bt#0  0x80483ea in wib (no1=8, no2=8) at eg1.c:7#1  0x8048435 in main (argc=1, argv=0xbffff9c4) at eg1.c:21

此結果顯示了在 main() 的第 21 行中調用了函數 wib()(只要使用 'list 21' 就能證實這一點),而且 wib() 在 0 號幀中,main() 在 1 號幀中。由於 wib() 在 0 號幀中,那麼它就是執行程式時發生算術錯誤的函數。

實際上,發出 'info locals' 命令時,gdb 會列印出當前幀中的局部變數,預設情況下,這個幀中的函數就是被中斷的函數(0 號幀)。可以使用命令 'frame' 列印當前幀。要查看 main 函數(在 1 號幀中)中的變數,可以發出 'frame 1' 切換到 1 號幀,然後發出 'info locals' 命令:

 
(gdb) frame 1#1  0x8048435 in main (argc=1, argv=0xbffff9c4) at eg1.c:2121          result = wib(value, div);(gdb) info localsvalue = 8div = 8result = 4i = 2total = 6

此資訊顯示了在第三次執行 "for" 迴圈時(i 等於 2)發生了錯誤,此時 "value" 等於 "div"。

可以通過如上所示在 'frame' 命令中明確指定號碼,或者使用 'up' 命令在堆棧中上移以及 'down' 命令在堆棧中下移來切換幀。要擷取有關幀的進一步資訊,如它的地址和程式語言,可以使用命令 'info frame'。

gdb 堆棧命令可以在程式執行期間使用,也可以在 core 檔案中使用,因此對於複雜的程式,可以在程式運行時跟蹤它是如何轉到函數的。

串連到其它進程

除了調試 core 檔案或程式之外,gdb 還可以串連到已經啟動並執行進程(它的程式已經過編譯,並加入了調試資訊),並中斷該進程。只需用希望 gdb 串連的進程標識替換 core 檔案名稱就可以執行此操作。以下是一個執行迴圈並睡眠的 樣本程式:

 

eg2 範例程式碼

#include int main(int argc, char *argv[]){  int i;  for(i = 0; i < 60; i++)  {    sleep(1);  }  return 0;}

 

使用 'gcc -g eg2.c -o eg2' 編譯該程式並使用 './eg2 &' 運行該程式。請留意在啟動該程式時在背景上列印的進程標識,在本例中是 1283:

 
./eg2 &[3] 1283

啟動 gdb 並指定進程標識,在我舉的這個例子中是 'gdb eg2 1283'。gdb 會尋找一個叫作 "1283" 的 core 檔案。如果沒有找到,那麼只要進程 1283 正在運行(在本例中可能在 sleep() 中),gdb 就會串連並中斷該進程:

 
.../home/seager/gdb/1283: No such file or directory.Attaching to program: /home/seager/gdb/eg2, Pid 1283...0x400a87f1 in __libc_nanosleep () from /lib/libc.so.6(gdb)

此時,可以發出所有常用 gdb 命令。可以使用 'backtrace' 來查看當前位置與 main() 的相對關係,以及 mian() 的幀號是什麼,然後切換到 main() 所在的幀,查看已經在 "for" 迴圈中運行了多少次:

 
(gdb) backtrace#0  0x400a87f1 in __libc_nanosleep () from /lib/libc.so.6#1  0x400a877d in __sleep (seconds=1) at ../sysdeps/unix/sysv/linux/sleep.c:78#2  0x80483ef in main (argc=1, argv=0xbffff9c4) at eg2.c:7(gdb) frame 2#2  0x80483ef in main (argc=1, argv=0xbffff9c4) at eg2.c:77           sleep(1);(gdb) print i$1 = 50

如果已經完成了對程式的修改,可以 'detach' 命令繼續執行程式,或者 'kill' 命令殺死進程。還可以首先使用 'file eg2' 裝入檔案,然後發出 'attach 1283' 命令串連到進程標識 1283 下的 eg2。

 

其它小技巧

gdb 可以讓您通過使用 shell 命令在不退出調試環境的情況下運行 shell 命令,調用形式是 'shell [commandline]',這有助於在調試時更改原始碼。

最後,在程式運行時,可以使用 'set ' 命令修改變數的值。在 gdb 下再次運行 eg1,使用命令 'break 7 if diff==0' 在第 7 行(將在此處計算結果)設定條件斷點,然後運行程式。當 gdb 中斷執行時,可以將 "diff" 設定成非零值,使程式繼續運行直至結束:

 
Breakpoint 1, wib (no1=8, no2=8) at eg1.c:77         result = no1 / diff;(gdb) print diff$1 = 0(gdb) set diff=1(gdb) continueContinuing.0 wibed by 16 equals 10Program exited normally.

結束語

GNU 調試器是所有程式員工具庫中的一個功能非常強大的工具。在本文中,我只介紹了 gdb 的一小部分功能。要瞭解更多知識,建議您閱讀 GNU 調試器手冊。

 

參考資料

  • 您可以參閱本文在 developerWorks 全球網站上的 英文原文.
  • GNU 調試器手冊
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.