[聲明:歡迎轉載,轉載請註明出自CU ACCESSORY http://linux.chinaunix.net/bbs/thread-1153868-1-1.html]
關於LINUX和WINDOWS的口水站已經很多了。本文企圖從技術角度來比較下2個主流作業系統的異同。偏重於核心部分。
一、動機:
我最早是 WINDOWS 陣營的。在WINDOWS下寫過2年多的驅動程式。後來由於學習需要,轉投LINUX,一晃也快2年了。期間經曆了很多曲折,也學到了很多東西。由於在開發WINDOWS 驅動的時候,經驗和知識都還不夠,所以現在我感覺對LINUX似乎更熟悉些。
當然,各2年的學習也只能說是入了門。每個作業系統都很博大精深,而且在不停的發展。所以我只是從個人的角度來比較下,難免有不足之處,歡迎大家指正。
我寫這篇文章希望能協助那些同樣從WINDOW陣營轉過來的同學,也希望對那些從LINUX轉到WINDOWS(比如老闆要求)的人們和對2者都感興趣的人們有些協助。
總的來說,我覺得2個作業系統各有所長。我喜歡LINUX的自由,開放,也喜歡 WINDOWS的統一,相容。下面將比較下2個作業系統的異同。
BTW:關於作業系統的版本,WINDOWS核心自WIN 2K 之後變化不是很大。我比較熟悉的也是WIN2K, WIN XP。而文中的LINUX 核心是2.6的。或者更明確的說是2.6.18。因為我對這個版本最熟悉。不過現在最新的好像已經 2.6.31了。另外關於2.6.18,引用本版T-Bagwell同學的一段話:“2.6.18貌似是相對比較穩定大版本,就像2.4.18一樣,相對很穩定,很多企業,嵌入式都採用”。我常用的CENTOS 5就是基於2.6.18的。
二、二者區別:
我覺得二者最大的區別在於WINDOWS是個商業軟體,而LINUX是開源軟體。商業軟體的好處是可以集中一大批人力物力做一件事情。容易統一,相容(因為客戶需求)。而開源的好處在於靈活,開放。
在下面的比較中,我一般先介紹下WINDOWS的,然後再介紹LINUX的。
1、觀念:商業 VS 開源
WINDOWS是個商業軟體,它的源碼是保密的. 當然,其他非MS的人也還是有機會看到源碼的. 如果你和MS 簽訂一個NDA(NON DISCLOSURE AGREEMENT),那麼你也有可能拿到WINDOWS代碼.
不過對於廣大窮學生,以及連VISUAL STUDIO都在用盜版的摳門公司來說,和MS簽個NDA幾乎是不可想象的. 所以在WINDOWS世界,想瞭解WINDOW 核心的具體資訊變得很難. 只能靠DDK(DRIVER DEVELOPMENT KIT) 和WINDBG(核心調試工具)泄漏出來的一些. 然後就是REVERSE ENGINEERING (逆向工程,可以簡單的理解為反組譯碼,實際上更複雜一些).
這也造成了 <WINDOWS INTERNALS> 一書超級火爆的原因. 因為它是微軟授權的,而且公布了很多內部細節. 另外一本講核心的書是<UNDOCUMENTED WINDOWS 2K SECRETS>,雖然老了點,但是很多內幕。關於WINDOWS, undocumented 和secrets 這2個字絕對是可以類比“超級美女”的字眼。因為這些東西平時是看不到的.
與此對應,在LINUX世界,常見的一個詞是RTFS。也就是READ THE FXXXXXX SOURCE CODE (這句話據說最早出於linus torvalds, 也就是LINUX之父)。意思也就是說“去讀該死的代碼”。言外之意,我把代碼都給你你了,你還想要啥啊?這就好像一個男人對他GF / LP / LD說,我把全部的銀行帳戶密碼都給你了,你還想要啥啊?
其實他不知道(或者認識不到)女人還需要你的時間,精力來陪她。就好像LINUX 程式員意識不到文檔也是很重要的。當然,LINUX程式員應該也是知道文檔的重要的,不過一個是維護成本太高,另外是LINUX 核心變化太快。所以LINUX 的文檔總感覺比MSDN要差點。
話說當年WIN 2K的源碼泄漏出來了一些,我也迫不及待的下載了一份.雖然至今也沒看過,但是拿到WINDOWS 源碼的感覺,絕對不比娶了一個絕世美女差. (當然,真要娶老婆還是看內在).
相比之下, LINUX 是開源的,代碼隨時可見. 這對剛從WINDOWS世界轉過來的我是十分震撼的. 雖然我一直都知道這個事實, 但是當你發現了以前需要用盡各種方法,採用各種手段才可以得到隻言片語的資訊現在完全呈獻在你面前的時候,你才能真正體會開源確實是一件偉大的工程.
看了LINUX源碼之後,我終於發現,原來核心裡大部分也是C語言(而不是以前想象的彙編). 同時核心似乎也就那樣,不像之前想象的那麼神秘. 原來編譯核心也就是比編譯個普通程式稍微麻煩點,用的時間長點. 原來編譯核心用普通的C編譯器就可以. 原來核心也是一個普通的可執行檔.(PS: 我懷疑MS也是用VS來編譯WINDOWS的. 同時我也知道WINDOWS核心也是一個可執行檔.) 原來更換核心是如此的簡單.
終於,核心可以被我隨便改了. 哇哈哈哈!
言規正傳,我覺得商業也還是有好處的。比如相容性好,我以前用WDM寫一個驅動,最多改下編譯選項就可以在WIN 98, WIN 2K, WIN XP下運行。十分方便。而如果換成LINUX,那麼你只好祈禱不同的核心版本之間沒改那些你用到的標頭檔,函數介面。否則就要改代碼了。
同時,開源的好處是適合學習,十分靈活。我覺得LINUX十分適合學校,學生。因為開源,當你發現不明白的地方的時候,可以直接去看源碼(還記得RTFS? )。看不懂還可以到論壇上問。而對於WINDOWS,你想瞭解它的內部機制就只好GOOGLE,然後祈禱了。比較好的一個資源是MSDN下面的一個雜誌,其中有一個主題叫UNDER THE HOOD, 或者搜搜 BUGSLAYER 也可以。這2個專題的作者Matt Pietrek和John Robbins都是大牛級的人物。
順便說下UNDER THE HOOD 這個名字本身。以前一直不太理解,因為查字典的話,HOOD 的意思也就是個蓋子。那麼蓋子下面有啥呢?為啥要看蓋子下面呢?
來到美國之後,我漸漸明白了。HOOD 在這裡應該理解為汽車的引擎蓋。在美國,汽車是很普遍的。如果你開車,但是從來沒開啟過引擎蓋,那麼說明你只會用,而不瞭解汽車內部。那麼如果你開啟蓋子看看呢?就可以看到很多內部細節,比如發動機啥的了。
在美國這個汽車王國,很多軟體術語和汽車有關,因為人們日常生活中對汽車也很瞭解。比如“引擎”這個詞,以前玩3D遊戲的時候,常會看到介紹說,本遊戲採用了最新的3D引擎。啥意思呢?就是遊戲最核心的部分(汽車引擎)已經升級了。不是只把外面的人物形象改了下而已。
另外,開源軟體也經常用汽車來類比。開源意外著你買了車(軟體)後,可以隨便拿到一個修理廠去修。也就是什麼人都可以改,只要他懂。而COPY RIGHT 軟體呢,就是你買了車,但是引擎蓋子是鎖著的,壞了只能去生產廠家修,其他人修不了。如果萬一生產廠家不想修或者不會修呢?那你就只能認命了。
扯得有點遠了,打住。
1.1、發布:2進位 VS 源碼
這裡主要討論下WINDOWS和LINUX在發布程式採用的不同的形式和觀念,這些和前面的商業還是開源的基本觀念是聯絡在一起的。
在WINDOWS 世界,安裝程式幾乎全部都是以二進位形式發布的。也就是說,使用者下載了一個程式,然後雙擊,一路NEXT,NEXT,NEXT就可以了。這個方法很適合初學者。在LINUX世界也有類似的機制,比如YUM, APT-GET 等。不過YUM和APT-GET都是比較晚才出現的,在那之前,在LINUX世界安裝程式要更麻煩些。
有的時候,LINUX的YUM, APT-GET還不夠用。比如有的人寫的一個小軟體,沒有放到這些大的公用的庫裡面。這時,你就會發現他們一般提供一個或者一堆源檔案,然後需要使用者自己下載,“編譯”,安裝。這也就是LINUX世界常見的原始碼發布的形式。
一開始的時候,十分不習慣LINUX的這種發布形式。用慣了WINDOWS的雙擊安裝,總覺得LINUX的安裝很麻煩,又要自己./CONFIGURE, MAKE, MAKE INSTALL. 萬一這個軟體又依賴於其他的庫,那麼又要自己去找那些庫,萬一那些庫又依賴其他的庫...... 另外,各種庫的版本也是一個問題,萬一不相容,那麼又要找一個相容的。
為什麼LINUX世界這麼多原始碼發布呢?為什麼WINDOWS世界流行2進位檔案發布,而不是原始碼呢?關於後者,很好解釋,因為WINDOWS那邊很多原始碼都是商業秘密,是不公開的。同時,WINDOWS的程式用到的那些庫在一般的系統裡都裝好了。所以2進位發布可行,也十分方便。
關於前一個問題,我覺得原始碼發布的一個好處是可以在編譯的時候進行一些最佳化和設定。比如同樣的代碼,在32或64位平台下編譯的時候可以進行適當的最佳化。另外,使用者也可以在編譯的時候設定一些開關,這樣在編譯期間的最佳化一般要好於已耗用時間的最佳化。
不過原始碼發布的一個壞處就是對使用者要求較高。如果運行configue,make命令順利的話還好。如果萬一不順利,要自己改下標頭檔啥的,無疑是一般的使用者無法做到的。另外庫之間的依賴關係如果是人手工處理的話也十分麻煩。好在LINUX世界後來有了YUM APT-GET之類的包管理系統。大多數軟體都可以很方便的安裝了。
2、進程及其建立 CreateProcess VS fork+execv
在WINDOWS世界,建立進程最常用的WIN 32 API 是 CreateProcess以及相關函數。這個函數需要一堆參數(WINDOWS API 的特點),不過很多參數可以簡單的用NULL, TRUE OR FALSE來表示。另外,你直接告訴它要執行的是哪個檔案。
到了LINUX世界,我模糊的知道fork是用來建立一個新進程的。但是當我看fork的函數說明的時候,呆住了。因為fork不需要任何參數。習慣了 CreateProcess 的10來個參數,突然換成一個不要任何參數的函數,感覺很奇妙。一方面覺得似乎事情簡單了很多,不用去把10來個參數的每個意思都搞明白。另外一方面又很疑惑,我怎麼告訴它我要執行某個檔案呢?
後來才知道,LINUX中的進程的含義和WINDOWS中是不一樣的。LINUX中的進程本身是可以執行的。而WINDOWS中,進程只是表示一個資源的擁有體,是不能執行的。要執行的話,一定需要一個線程。這也部分解釋了為什麼CreateProcess中為啥一定要傳入要執行的檔案的名字。
而fork的含義是把進程本身CLONE一個新的出來。也就是說,FORK之後,父進程和子進程都執行同樣的一段代碼。如果想區分的話,可以根據FORK的傳回值來區分。引用一段fork的說明:
On success, the PID of the child process is returned in the parent's thread of execution, and a 0 is returned in the child's thread of execution.
同時在LINUX程式中,常見的寫法如下:
int pid; pid = fork(); switch (pid) { case 0: //I am the child
; case -1: //failed.
; default: //I am the parent
} |
為什麼要這樣設計呢?因為LINUX的設計目標之一就是應用於伺服器。這種情況下,一個SERVICE可能會啟動很多進程(線程)來服務不同的CLIENT. 所以FORK設計成快速複製父進程。子進程直接使用父親的地址空間,只有子進程載入一個新的可執行檔的時候才建立自己的地址空間。
這樣節省了建立地址空間這個龐大的開銷,使得LINUX的進程建立十分快。不過實際上,這裡的進程相對於WINDOWS中的線程,所以同WINDOWS中的線程建立相比,二者的開銷應該差不多。
那麼如何才能讓新的進程載入一個可執行檔呢,這時就要用execv以及相關函數了。所以LINUX中,代替CreateProcess()的函數是fork+execv
3、檔案格式 PE VS ELF
WINDOWS中的可執行檔格式是PE。到了LINUX就變成了ELF。2者有相似的地方,比如都分成幾個SECTION,包含程式碼片段,資料區段等。但是2個又不一樣。使得從一個轉到另外一個的人不得不重新學習下。有點象在國內開慣了車的人,到了香港或者英國開車,雖然也是4個輪子一個方向盤,但是一個靠左行駛,一個靠右。總是需要些時間來習慣。
那麼為啥LINUX不能和WINDOWS用同樣的檔案格式呢?我覺得可能的原因有幾個。首先可能是2個差不多同時在設計的,彼此不知道對方的存在。所以也沒法一方壓倒一方。另外一個可能的原因是PE格式最開始還是保密的(後來MS公開了PE的SPEC),所以即使LINUX想直接用PE都不行。
順便說下,MS OFFICE 的文檔格式以前也是保密的,直到最近(好像是2008年)才公開。希望這可以使得OPEN OFFICE的開發順利很多。
4、核心API:固定 VS 非固定
WINDOWS核心有一套固定的API,而且向後相容。這使得WINDOWS 驅動的開發人員在不同版本之間移植時變得很容易。比如我用WDM (WINDOWS DEVICE MODEL) 開發一個驅動,最多改下編譯選項就可以在WIN 98, 2K, XP, 2003 下使用。VISTA 我覺得也許都可以。
而LINUX沒有固定的核心API。2.4版本的核心模組在2.6幾乎很大可能是不能相容的。要移植的話,不只是改個編譯選項,而是要改一堆的標頭檔和實現檔案等。而麻煩的是,即使都是2.6核心,不同的小版本之間也有些不同。如果你的核心模組剛好用到了變化的部分,那麼也只好重新學習,然後改自己的標頭檔或者實現檔案了。
固定核心API的好處是相容性好,壞處是包袱比較大,不得不隨時支援老的,也許是過時的介面。比如WINDOWS核心裡有WDM 一套API, 但是又有網卡專用的 NDIS 一套API. 實際上2套API的很多設計目標是重合的。那麼為什麼有2個呢?因為NDIS是先出來的,為了相容性,一定要支援。而NDIS又只針對網卡,所以又出來了WDM。
不固定API的壞處是升級很麻煩,外圍的核心模組維護者很辛苦。好處是可以隨時採用更新的設計。
5. WINDOWS與LINUX中的中斷處理比較
5.1不同之處:
在WINDOWS中,有一個IRQL (注意不是IRQ)的概念。最早的時候,我以為是CPU設計裡就包括了這個東東。後來看INTEL CPU手冊,發現似乎沒有。最近又看了一遍WINDOWS INTERALS 4TH。感覺這個東西應該是包括在PIC OR APIC裡面的(關於APIC,可以看我以前的文章)。對於X86-32,硬體裝置的IRQ於IRQL之間的關係是:IRQL= 27-IRQ。引入IRQL的動機似乎是這樣的:當CPU運行在低IRQL時,如果來了一個高IRQL對應的中斷,那麼低的中斷的ISR是會被高的ISR搶過去的。就是說低的ISR又被一個更進階的ISR中斷了。這樣的好處是優先順序高的ISR可以更快的得到響應。
另外,在具體實現中,由於操作PIC OR APCI改IRQL是比較費時的,所以WINDOWS是盡量不去直接操作硬體,而是等到萬不得已的時候才改。
在LINUX中,似乎沒有類似IRQL這樣的觀念。就我目前看過的書和代碼來看,LINUX中的ISR或者是KERNLE最多是操作下CPU上的中斷標誌位(IF)來開啟或者關閉中斷。也就是說,要麼中斷全開,要麼全關。
從這一點來看,LINUX在這部分的設計上比WINDOWS簡單。
5.2 相似之處:
WINDOWS和LINUX似乎都把中斷分成了2部分。在LINUX中叫ISR(還是其他?)和BOTTOM HALF。而WINODWS中,DPC(Deferred Procedure Calls)和APC(Asynchronous Procedure Calls)就非常類似BOTTOM HALF。二者把中斷分成兩部分的動機是差不多的。都是為了把ISR搞得越快越好。LINUX中,在ISR裡一般關中斷,所以時間太長的話,其他中斷就得不到響應。WINDOWS中,ISR跑在一個很高的IRQL裡面,同樣會阻塞其他IRQL比較低的任務。
LINUX中的BOTTOM HALF 又可以分為TASKLET 和SOFIRQ。二者的主要區別是複雜度和並發性(CONCURRENCY)。下面COPY自<UNDERSTANDING LINUX NETWORK INTERNALS>一書。
Tasklet: Only one instance of each tasklet can run at any time. Different tasklets can run concurrently on different CPUs.
Softirq: Only one instance of each softirq can run at the same time on a CPU. However, the same softirq can run on different CPUs concurrentlyOnly one instance of each softirq can run at the same time on a CPU. However, the same softirq can run on different CPUs concurrently.
WINDOWS中的DPC有點類似TASKLET和SOFTIRQ。 DPC是系統範圍內的,並且運行在DPC IRQL。是一個類似中斷內容相關的環境(INTERRUPT CONTEXT)。APC和DPC的區別是運行在更低層級的APC IRQL。另外,APC是針對每一個線程的。執行在某個線程環境中。主要目的也是把一部分事情放到以後去執行。APC又分為KERNEL APC 和USER APC。APC這個觀念在LINUX中似乎沒有類似的?至少我還沒想到。
5.3 參考文獻:
1. WINDOWS INTERALS 4TH
2. UNDERSTANDING LINUX NETWORK INTERNALS, 2005
UNICODE VS ASCII
KERNEL 4M/4K MIXED PAGE VS 4K PAGE
FS SEGMENT VS NO FS
GDI VS XWINDOWS
IRP VS FUNCTION POINTER
註冊表 VS 普通檔案
三、一致的地方
WINDOWS和LINUX很多地方又很相似。我覺得基本原因有2個。一個是2者都繼續了一部分UNIX中的東西。另外一個是2者都主要基於X86體繫結構。當然2者也都支援很多其他體繫結構,特別是LINUX。
我下面主要討論在X86體系下一致的地方。
1、觀念
一起皆檔案。
2、核心映射:2G:2G, 1G:3G. 線性映射
3、SOCKET
4、DEVICE DRIVER OR KERNEL MODULE
5、系統調用,中斷