Linux的發行版中包含了很多軟體開發工具. 它們中的很多是用於 C 和 C++應用程式開發的. 本文介紹了在 Linux 下能用於 C 應用程式開發和調試的工具. 本文的主旨是介紹如何在 Linux 下使用 C 編譯器和其他 C 編程工具, 而非 C 語言編程的教程.
GNU C 編譯器
GNU C 編譯器(GCC)是一個全功能的 ANSI C 相容編譯器. 如果你熟悉其他動作系統或硬體平台上的一種 C 編譯器, 你將能很快地掌握 GCC. 本節將介紹如何使用 GCC 和一些 GCC 編譯器最常用的選項.
使用 GCC
通常後跟一些選項和檔案名稱來使用 GCC 編譯器. gcc 命令的基本用法如下:
gcc [options] [filenames]
命令列選項指定的操作將在命令列上每個給出的檔案上執行. 下一小節將敘述一些你會最常用到的選項.
GCC 選項
GCC 有超過100個的編譯選項可用. 這些選項中的許多你可能永遠都不會用到, 但一些主要的選項將會頻繁用到. 很多的 GCC 選項包括一個以上的字元. 因此你必須為每個選項指定各自的連字號, 並且就象大多數 Linux 命令一樣你不能在一個單獨的連字號後跟一組選項. 例如, 下面的兩個命令是不同的:
gcc -p -g test.c
gcc -pg test.c
第一條命令告訴 GCC 編譯 test.c 時為 prof 命令建立剖析(profile)資訊並且把調試資訊加入到可執行檔檔案裡. 第二條命令只告訴 GCC 為 gprof 命令建立剖析資訊.
當你不用任何選項編譯一個程式時, GCC 將會建立(假定編譯成功)一個名為 a.out 的可執行檔. 例如, 下面的命令將在目前的目錄下產生一個叫 a.out 的檔案:
gcc test.c
你能用 -o 編譯選項來為將產生的可執行檔指定一個檔案名稱來代替 a.out. 例如, 將一個叫 count.c 的 C 程式編譯為名叫 count 的可執行檔, 你將輸入下面的命令:
gcc -o count count.c
--------------------------------------------------------------------------------
注意: 當你使用 -o 選項時, -o 後面必須跟一個檔案名稱.
--------------------------------------------------------------------------------
GCC 同樣有指定編譯器處理多少的編譯選項. -c 選項告訴 GCC 僅把原始碼編譯為目標代碼而跳過彙編和串連的步驟. 這個選項使用的非常頻繁因為它使得編譯多個 C 程式時速度更快並且更易於管理. 預設時 GCC 建立的目標代碼檔案有一個 .o 的副檔名.
-S 編譯選項告訴 GCC 在為 C 代碼產生了組合語言檔案後停止編譯. GCC 產生的組合語言檔案的預設副檔名是 .s . -E 選項指示編譯器僅對輸入檔案進行預先處理. 當這個選項被使用時, 前置處理器的輸出被送到標準輸出而不是儲存在檔案裡.
優 化 選 項
當 你用 GCC 編譯 C 代碼時, 它會試著用最少的時間完成編譯並且使編譯後的代碼易於調試. 易於調試意味著編譯後的代碼與原始碼有同樣的執行次序, 編譯後的代碼沒有經過最佳化. 有很多選項可用於告訴 GCC 在耗費更多編譯時間和犧牲易調試性的基礎上產生更小更快的可執行檔. 這些選項中最典型的是-O 和 -O2 選項.
-O 選項告訴 GCC 對原始碼進行基本最佳化. 這些最佳化在大多數情況下都會使程式執行的更快. -O2 選項告訴 GCC 產生儘可能小和儘可能快的代碼. -O2 選項將使編譯的速度比使用 -O 時慢. 但通常產生的代碼執行速度會更快.
除 了 -O 和 -O2 最佳化選項外, 還有一些低級選項用於產生更快的代碼. 這些選項非常的特殊, 而且最好只有當你完全理解這些選項將會對編譯後的代碼產生什麼樣的效果時再去使用. 這些選項的詳細描述, 請參考 GCC 的指南頁, 在命令列上鍵入 man gcc .
調試和剖析選項
GCC 支援數種調試和剖析選項. 在這些選項裡你會最常用到的是 -g 和 -pg 選項.
-g 選項告訴 GCC 產生能被 GNU 調試器使用的調試資訊以便調試你的程式. GCC 提供了一個很多其他 C 編譯器裡沒有的特性, 在 GCC 裡你能使 -g 和 -O (產生最佳化代碼)聯用. 這一點非常有用因為你能在與最終產品儘可能相近的情況下調試你的代碼. 在你同時使用這兩個選項時你必須清楚你所寫的某些代碼已經在最佳化時被 GCC 作了改動. 關於調試 C 程式的更多資訊請看下一節"用 gdb 調試 C 程式" .
-pg 選項告訴 GCC 在你的程式裡加入額外的代碼, 執行時, 產生 gprof 用的剖析資訊以顯示你的程式的耗時情況. 關於 gprof 的更多資訊請參考 "gprof" 一節.
用 gdb 調試 GCC 程式
Linux 包含了一個叫 gdb 的 GNU 偵錯工具. gdb 是一個用來調試 C 和 C++ 程式的強力調試器. 它使你能在程式運行時觀察程式的內部結構和記憶體的使用方式. 以下是 gdb 所提供的一些功能:
它使你能監視你程式中變數的值.
它使你能設定斷點以使程式在指定的程式碼上停止執行.
它使你能一行行的執行你的代碼.
在命令列上鍵入 gdb 並按斷行符號鍵就可以運行 gdb 了, 如果一切正常的話, gdb 將被啟動並且你將在螢幕上看到類似的內容:
GNU gdb 5.0
Copyright 2000 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB. Type "show warranty" for details.
This GDB was configured as "i386-redhat-linux".
(gdb)
當你啟動 gdb 後, 你能在命令列上指定很多的選項. 你也可以以下面的方式來運行 gdb :
gdb
當 你用這種方式運行 gdb , 你能直接指定想要調試的程式. 這將告訴gdb 裝入名為 fname 的可執行檔. 你也可以用 gdb 去檢查一個因程式異常終止而產生的 core 檔案, 或者與一個正在啟動並執行程式相連. 你可以參考 gdb 指南頁或在命令列上鍵入 gdb -h 得到一個有關這些選項的說明的簡單列表.
為調試編譯代碼(Compiling Code for Debugging)
為了使 gdb 正常工作, 你必須使你的程式在編譯時間包含調試資訊. 調試資訊包含你程式裡的每個變數的類型和在可執行檔裡的地址映射以及原始碼的行號. gdb 利用這些資訊使原始碼和機器碼相關聯.
在編譯時間用 -g 選項開啟調試選項.
gdb 基本命令
gdb 支援很多的命令使你能實現不同的功能. 這些命令從簡單的檔案裝入到允許你檢查所調用的堆棧內容的複雜命令, 表27.1列出了你在用 gdb 調試時會用到的一些命令. 想瞭解 gdb 的詳細使用請參考 gdb 的指南頁.
基本 gdb 命令.
命 令 描 述
file 裝入想要調試的可執行檔.
kill 終止正在調試的程式.
list 列出產生執行檔案的原始碼的一部分.
next 執行一行原始碼但不進入函數內部.
step 執行一行原始碼而且進入函數內部.
run 執行當前被調試的程式
quit 終止 gdb
watch 使你能監視一個變數的值而不管它何時被改變.
print 顯示運算式的值
break 在代碼裡設定斷點, 這將使程式執行到這裡時被掛起.
make 使你能不退出 gdb 就可以重新產生可執行檔.
shell 使你能不離開 gdb 就執行 UNIX shell 命令.
gdb 支援很多與 UNIX shell 程式一樣的命令編輯特徵. 你能象在 bash 或 tcsh裡那樣按 Tab 鍵讓 gdb 幫你補齊一個唯一的命令, 如果不唯一的話 gdb 會列出所有匹配的命令. 你也能用游標鍵上下翻動曆史命令.
gdb 應用舉例
本節用一個執行個體教你一步步的用 gdb 偵錯工具. 被調試的程式相當的簡單, 但它展示了 gdb 的典型應用.
下面列出了將被調試的程式. 這個程式被稱為 hello , 它顯示一個簡單的問候, 再用反序將它列出.
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
}
void my_print (char *string)
{
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2;
int size, i;
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++)
string2[size - i] = string[i];
string2[size+1] = ;
printf ("The string printed backward is %s ", string2);
}
用下面的命令編譯它:
gcc -g -o hello hello.c
這個程式執行時顯示如下結果:
./hello
The string is hello world!
The string printed backward is
輸出的第一行是正確的, 但第二行列印出的東西並不是我們所期望的. 我們所設想的輸出應該是:
The string printed backward is !dlrow olleh
由於某些原因, my_print2 函數沒有正常工作. 讓我們用 gdb 看看問題究竟出在哪兒, 先鍵入如下命令:
gdb hello
--------------------------------------------------------------------------------
注意: 記得在編譯 hello 程式時把調試選項開啟.
--------------------------------------------------------------------------------
如果你在輸入命令時忘了把要調試的程式作為參數傳給 gdb , 你可以在 gdb 提示符下用 file 命令來載入它:
(gdb) file hello
這個命令將載入 hello 可執行檔就象你在 gdb 命令列裡裝入它一樣.
這時你能用 gdb 的 run 命令來運行 hello 了. 當它在 gdb 裡被運行後結果大約會象這樣:
(gdb) run
Starting program: /root/hello
The string is hello world!
The string printed backward is
Program exited with code 040
這個輸出和在 gdb 外面啟動並執行結果一樣. 問題是, 為什麼反序列印沒有工作? 為了找出癥結所在, 我們可以在 my_print2 函數的 for 語句後設一個斷點, 具體的做法是在 gdb 提示符下鍵入 list 命令三次, 列出原始碼:
(gdb) list
(gdb) list
(gdb) list
--------------------------------------------------------------------------------
技巧: 在 gdb 提示符下按斷行符號健將重複上一個命令.
--------------------------------------------------------------------------------
第一次鍵入 list 命令的輸出如下:
1 #include
2
3 static void my_print (char *);
4 static void my_print2 (char *);
5
6 main ()
7 {
8 char my_string[] = "hello world!";
9 my_print (my_string);
10 my_print2 (my_string);
如果按下斷行符號, gdb 將再執行一次 list 命令, 給出下列輸出:
11 }
12
13 void my_print (char *string)
14 {
15 printf ("The string is %s ", string);
16 }
17
18 void my_print2 (char *string)
19 {
20 char *string2;
再按一次斷行符號將列出 hello 程式的剩餘部分:
21 int size, i;
22
23 size = strlen (string);
24 string2 = (char *) malloc (size + 1);
25 for (i = 0; i < size; i++)
26 string2[size - i] = string[i];
27 string2[size+1] = ;
28
29 printf ("The string printed backward is %s ", string2);
30 }
根據列出的來源程式, 你能看到要設斷點的地方在第26行, 在 gdb 命令列提示符下鍵入如下命令設定斷點:
(gdb) break 26
gdb 將作出如下的響應:
Breakpoint 1 at 0x804857c: file hello.c, line 26.
(gdb)
現在再鍵入 run 命令, 將產生如下的輸出:
Starting program: /root/hello
The string is hello world!
Breakpoint 1, my_print2 (string=0xbffffab0 "hello world!") at hello.c:26
26 string2[size - i] = string[i];
你能通過設定一個觀察 string2[size - i] 變數的值的觀察點來看出錯誤是怎樣產生的, 做法是鍵入:
(gdb) watch string2[size - i]
gdb 將作出如下回應:
Hardware watchpoint 2: string2[size - i]
現在可以用 next 命令來一步步的執行 for 迴圈了:
(gdb) next
經過第一次迴圈後, gdb 告訴我們 string2[size - i] 的值是 `h`. gdb 用如下的顯示來告訴你這個資訊:
Hardware watchpoint 2: string2[size - i]
Old value = 0 0
New value = 104 h
my_print2 (string=0xbffffab0 "hello world!") at hello.c:25
25 for (i = 0; i < size; i++)
這個值正是期望的. 後來的數次迴圈的結果都是正確的. 當 i=11 時, 運算式 string2[size - i] 的值等於 `!`, size - i 的值等於 1, 最後一個字元已經拷到新串裡了.
如 果你再把迴圈執行下去, 你會看到已經沒有值分配給 string2[0] 了, 而它是新串的第一個字元, 因為 malloc 函數在分配記憶體時把它們初始化為空白(null)字元. 所以 string2 的第一個字元是Null 字元. 這解釋了為什麼在列印 string2 時沒有任何輸出了.
現在找出了問題出在哪裡, 修正這個錯誤是很容易的. 你得把代碼裡寫入 string2 的第一個字元的的位移量改為 size - 1 而不是 size. 這是因為 string2 的大小為 12, 但起始位移量是 0, 串內的字元從位移量 0 到 位移量 10, 位移量 11 為空白字元保留.
改正方法非常簡單. 這是這種解決辦法的代碼:
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
}
void my_print (char *string)
{
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2;
int size, i;
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++)
string2[size -1 - i] = string[i];
string2[size] = ;
printf ("The string printed backward is %s ", string2);
}
如 果程式產生了core檔案,可以用gdb hello core命令來查看程式在何處出錯。如在函數my_print2()中,如果忘記了給string2分配記憶體 string2 = (char *) malloc (size + 1);,很可能就會core dump.
另外的 C 編程工具
xxgdb
xxgdb 是 gdb 的一個基於 X Window 系統的圖形介面. xxgdb 包括了命令列版的 gdb 上的所有特性. xxgdb 使你能通過按按鈕來執行常用的命令. 設定了斷點的地方也用圖形來顯示.
你能在一個 Xterm 視窗裡鍵入下面的命令來運行它:
xxgdb
你能用 gdb 裡任何有效命令列選項來初始化 xxgdb . 此外 xxgdb 也有一些特有的命令列選項, 表 27.2 列出了這些選項.
表 27.2. xxgdb 命令列選項.
選 項 描 述
db_name 指定所用調試器的名字, 預設是 gdb.
db_prompt 指定調試器提示符, 預設為 gdb.
gdbinit 指定初始化 gdb 的命令檔案的檔案名稱, 預設為 .gdbinit.
nx 告訴 xxgdb 不執行 .gdbinit 檔案.
bigicon 使用大表徵圖.
calls
你可以在 sunsite.unc.edu FTP 網站用下面的路徑:
/pub/Linux/devel/lang/c/calls.tar.Z
來 取得 calls , 一些舊版本的 Linux CD-ROM 發行版裡也附帶有. 因為它是一個有用的工具, 我們在這裡也介紹一下. 如果你覺得有用的話, 從 BBS, FTP, 或另一張CD-ROM 上弄一個拷貝. calls 調用 GCC 的前置處理器來處理給出的來源程式檔案, 然後輸出這些檔案的裡的函數調用樹圖.
注意: 在你的系統上安裝 calls , 以超級使用者身份登入後執行下面的步驟: 1. 解壓和 untar 檔案. 2. cd 進入 calls untar 後建立的子目錄. 3. 把名叫 calls 的檔案移動到 /usr/bin 目錄. 4. 把名叫 calls.1 的檔案移動到目錄 /usr/man/man1 . 5. 刪除 /tmp/calls 目錄. 這些步驟將把 calls 程式和它的指南頁安裝載你的系統上.
--------------------------------------------------------------------------------
當 calls 列印出調用跟蹤結果時, 它在函數後面用中括弧給出了函數所在檔案的檔案名稱:
main [hello.c]
如果函數並不是向 calls 給出的檔案裡的, calls 不知道所調用的函數來自哪裡, 則只顯示函數的名字:
printf
calls 不對遞迴和靜態函數輸出. 遞迴函式顯示成下面的樣子:
fact <<< recursive in factorial.c >>>
靜態函數象這樣顯示:
total [static in calculate.c]
作為一個例子, 假設用 calls 處理下面的程式:
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
my_print (my_string);
}
void count_sum()
{
int i,sum=0;
for(i=0; i<1000000; i++)
sum += i;
}
void my_print (char *string)
{
count_sum();
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2;
int size, i,sum =0;
count_sum();
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++) string2[size -1 - i] = string[i];
string2[size] = ;
for(i=0; i<5000000; i++)
sum += i;
printf ("The string printed backward is %s ", string2);
}
將產生如下的輸出:
1 __underflow [hello.c]
2 main
3 my_print [hello.c]
4 count_sum [hello.c]
5 printf
6 my_print2 [hello.c]
7 count_sum
8 strlen
9 malloc
10 printf
calls 有很多命令列選項來設定不同的輸出格式, 有關這些選項的更多資訊請參考 calls 的指南頁. 方法是在命令列上鍵入 calls -h .
calltree
calltree與calls類似,初了輸出函數調用樹圖外,還有其它詳細的資訊。
可以從sunsite.unc.edu FTP 網站用下面的路徑:/pub/Linux/devel/lang/c/calltree.tar.gz得到calltree.
cproto
cproto 讀入 C 來源程式檔案並自動為每個函數產生原型申明. 用 cproto 可以在寫程式時為你節省大量用來定義函數原型的時間.
如果你讓 cproto 處理下面的代碼(cproto hello.c):
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
}
void my_print (char *string)
{
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2;
int size, i;
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++)
string2[size -1 - i] = string[i];
string2[size] = ;
printf ("The string printed backward is %s ", string2);
}
你將得到下面的輸出:
/* hello.c */
int main(void);
int my_print(char *string);
int my_print2(char *string);
這個輸出可以重新導向到一個定義函數原型的包含檔案裡.
indent
indent 公用程式是 Linux 裡包含的另一個編程工具 + 生產力. 這個工具簡單的說就為你的代碼產生美觀的縮排的格式. indent 也有很多選項來指定如何格式化你的原始碼.這些選項的更多資訊請看indent 的指南頁, 在命令列上鍵入 indent -h .
下面的例子是 indent 的預設輸出:
運行 indent 以前的 C 代碼:
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
}
void my_print (char *string)
{
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2; int size, i;
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++) string2[size -1 - i] = string[i];
string2[size] = ;
printf ("The string printed backward is %s ", string2);
}
運行 indent 後的 C 代碼:
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
}
void
my_print (char *string)
{
printf ("The string is %s ", string);
}
void
my_print2 (char *string)
{
char *string2;
int size, i;
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++)
string2[size - 1 - i] = string[i];
string2[size] = ;
printf ("The string printed backward is %s ", string2);
}
indent 並不改變代碼的實質內容, 而只是改變代碼的外觀. 使它變得更可讀, 這永遠是一件好事.
gprof
gprof 是安裝在你的 Linux 系統的 /usr/bin 目錄下的一個程式. 它使你能剖析你的程式從而知道程式的哪一個部分在執行時最費時間.
gprof 將告訴你程式裡每個函數被調用的次數和每個函數執行時所佔時間的百分比. 你如果想提高你的程式效能的話這些資訊非常有用.
為了在你的程式上使用 gprof, 你必須在編譯器時加上 -pg 選項. 這將使程式在每次執行時產生一個叫 gmon.out 的檔案. gprof 用這個檔案產生剖析資訊.
在你運行了你的程式併產生了 gmon.out 檔案後你能用下面的命令獲得剖析資訊:
gprof
參數 program_name 是產生 gmon.out 檔案的程式的名字.
為了說明問題,在程式中增加了函數count_sum()以消耗CPU時間,程式如下
#include
static void my_print (char *);
static void my_print2 (char *);
main ()
{
char my_string[] = "hello world!";
my_print (my_string);
my_print2 (my_string);
my_print (my_string);
}
void count_sum()
{
int i,sum=0;
for(i=0; i<1000000; i++)
sum += i;
}
void my_print (char *string)
{
count_sum();
printf ("The string is %s ", string);
}
void my_print2 (char *string)
{
char *string2;
int size, i,sum =0;
count_sum();
size = strlen (string);
string2 = (char *) malloc (size + 1);
for (i = 0; i < size; i++) string2[size -1 - i] = string[i];
string2[size] = ;
for(i=0; i<5000000; i++)
sum += i;
printf ("The string printed backward is %s ", string2);
}
$ gcc -pg -o hello hello.c
$ ./hello
$ gprof hello ¦ more
將產生以下的輸出
Flat profile:
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls us/call us/call name
69.23 0.09 0.09 1 90000.00 103333.33 my_print2
30.77 0.13 0.04 3 13333.33 13333.33 count_sum
0.00 0.13 0.00 2 0.00 13333.33 my_print
% 執行此函數所佔用的時間占程式總
time 執行時間的百分比
cumulative 累計秒數 執行此函數花費的時間
seconds (包括此函數調用其它函數花費的時間)
self 執行此函數花費的時間
seconds (調用其它函數花費的時間不計算在內)
calls 調用次數
self 每此執行此函數花費的微秒時間
us/call
total 每此執行此函數加上它調用其它函數
us/call 花費的微秒時間
name 函數名
由以上資料可以看出,執行my_print()函數本身沒花費什麼時間,但是它又調用了count_sum()函數,所以累計秒數為0.13.
技巧: gprof 產生的剖析資料很大, 如果你想檢查這些資料的話最好把輸出重新導向到一個檔案裡.
來源:LinuxAid