標籤:結構 containe ber bre 沒有 導致 抽象 phi tle
PS: 我先旁觀下大師們的討論,得多看書了~ 別人說的:“看了一下不覺得評註對到哪裡去,只有吹毛求疵之感。 比如同步非同步介紹,本來就無大錯;比如node圖裡面的OS operation,推敲一下就可以猜到那是指同步操作(自然不走event loop了);至於watcher啥的,顯然只是實現上的特色,即使用同一個queue實現也未嘗不可” 【原帖: http://www.ruanyifeng.com/blog/2014/10/event-loop.html 阮一峰】一年前,我寫了一篇《什麼是 Event Loop?》,談了我對Event Loop的理解。 上個月,我偶然看到了Philip Roberts的演講《Help, I‘m stuck in an event-loop》。這才尷尬地發現,自己的理解是錯的。我決定重寫這個題目,詳細、完整、正確地描述JavaScript引擎的內部運行機制。下面就是我的重寫。 【JavaScript引擎的內部運行機制跟Event loop沒有半毛錢的關係。】【這裡的錯誤在於要分清楚JavaScript執行環境和執行引擎的關係,通常說的引擎指的是虛擬機器,對於Node來說是V8、對Chrome來說是V8、對Safari來說JavaScript Core,對Firefox來說是SpiderMonkey。JavaScript的執行環境很多,上面說的各種瀏覽器、Node、Ringo等。前者是Engine,後者是Runtime。】【對於Engine來說,他們要實現的是ECMAScript標準。對於什麼是event loop,他們沒興趣,不關心。】【準確的講,要說的應該是Runtime的執行機制。】 進入本文之前,插播一條訊息。我的新書《ECMAScript 6入門》出版了(著作權頁,內頁1,內頁2),證券紙全彩印刷,非常精美,還附有索引(當然價格也比同類書籍略貴一點點)。預覽和購買點擊這裡。 【新書還是要支援】 一、為什麼JavaScript是單線程? JavaScript語言的一大特點就是單線程,也就是說,同一個時間只能做一件事。那麼,為什麼JavaScript不能有多個線程呢?這樣能提高效率啊。 JavaScript的單線程,與它的用途有關。作為瀏覽器指令碼語言,JavaScript的主要用途是與使用者互動,以及操作DOM。這決定了它只能是單線程,否則會帶來很複雜的同步問題。比如,假定JavaScript同時有兩個線程,一個線程在某個DOM節點上新增內容,另一個線程刪除了這個節點,這時瀏覽器應該以哪個線程為準? 所以,為了避免複雜性,從一誕生,JavaScript就是單線程,這已經成了這門語言的核心特徵,將來也不會改變。 為了利用多核CPU的計算能力,HTML5提出Web Worker標準,允許JavaScript指令碼建立多個線程,但是子線程完全受主線程式控制制,且不得操作DOM。所以,這個新標準並沒有改變JavaScript單線程的本質。 【這段沒啥大問題,謝謝阮老師】二、任務隊列 單線程就意味著,所有任務需要排隊,前一個任務結束,才會執行後一個任務。如果前一個任務耗時很長,後一個任務就不得不一直等著。 如果排隊是因為計算量大,CPU忙不過來,倒也算了,但是很多時候CPU是閑著的,因為IO裝置(輸入輸出裝置)很慢(比如Ajax操作從網路讀取資料),不得不等著結果出來,再往下執行。 JavaScript語言的設計者意識到,這時CPU完全可以不管IO裝置,掛起處於等待中的任務,先運行排在後面的任務。等到IO裝置返回了結果,再回過頭,把掛起的任務繼續執行下去。 【這個跟Brendan Eich沒半毛錢關係。進程在處理IO操作的時候,作業系統多半自動將CPU切給其他進程用了】 於是,JavaScript就有了兩種執行方式:一種是CPU按順序執行,前一個任務結束,再執行下一個任務,這叫做同步執行;另一種是CPU跳過等待時間長的任務,先處理後面的任務,這叫做非同步執行。程式員自主選擇,採用哪種執行方式。 【純粹扯蛋。】【給CPU啥指令它就執行啥,哪有什麼CPU跳過等待時間長的任務。】【歸根結底,阮老師沒有懂什麼叫非同步。】 具體來說,非同步執行的運行機制如下。(同步執行也是如此,因為它可以被視為沒有非同步任務的非同步執行。) 【上面這句話表現出不僅不懂什麼是非同步,更不懂什麼是同步。】
(1)所有任務都在主線程上執行,形成一個執行棧(execution context stack)。
(2)主線程之外,還存在一個"任務隊列"(task queue)。系統把非同步任務放到"任務隊列"之中,然後繼續執行後續的任務。
(3)一旦"執行棧"中的所有任務執行完畢,系統就會讀取"任務隊列"。如果這個時候,非同步任務已經結束了等待狀態,就會從"任務隊列"進入執行棧,恢複執行。
(4)主線程不斷重複上面的第三步。
【上面這段初步地在說event loop。但是非同步跟event loop其實沒有關係。準確的講,event loop是實現非同步一種機制】【一般而言,操作分為:發出調用和得到結果兩步。發出調用,立即得到結果是為同步。發出調用,但無法立即得到結果,需要額外的操作才能得到預期的結果是為非同步。同步就是調用之後一直等待,直到返回結果。非同步則是調用之後,不能直接拿到結果,通過一系列的手段才最終拿到結果(調用之後,拿到結果中間的時間可以介入其他任務)。】【上面提到的一系列的手段其實就是實現非同步方法,其中就包括event loop。以及輪詢、事件等。】【所謂輪詢:就是你在收銀台付錢之後,坐到位置上不停的問服務員你的菜做好了沒。】【所謂(事件):就是你在收銀台付錢之後,你不用不停的問,飯菜做好了服務員會自己告訴你。】 就是主線程和任務隊列的。
只要主線程空了,就會去讀取"任務隊列",這就是JavaScript的運行機制。這個過程會不斷重複。
【JavaScript運行環境的運行機制,不是JavaScript的運行機制。】三、事件和回呼函數 "任務隊列"實質上是一個事件的隊列(也可以理解成訊息的隊列),IO裝置完成一項任務,就在"任務隊列"中添加一個事件,表示相關的非同步任務可以進入"執行棧"了。主線程讀取"任務隊列",就是讀取裡面有哪些事件。 【任務隊列既不是事件的隊列,也不是訊息的隊列。】【任務隊列就是你在主線程上的一切調用。】【所謂的事件驅動,就是將一切抽象為事件。IO操作完成是一個事件,使用者點擊一次滑鼠是事件,Ajax完成了是一個事件,一個圖片載入完成是一個事件】【一個任務不一定產生事件,比如擷取目前時間。】【當產生事件後,這個事件會被放進隊列中,等待被處理】
"任務隊列"中的事件,除了IO裝置的事件以外,還包括一些使用者產生的事件(比如滑鼠點擊、頁面滾動等等)。只要指定過回呼函數,這些事件發生時就會進入"任務隊列",等待主線程讀取。
所謂"回呼函數"(callback),就是那些會被主線程掛起來的代碼。非同步任務必須指定回呼函數,當非同步任務從"任務隊列"回到執行棧,回呼函數就會執行。 【他們壓根就沒有被執行過,何來掛起之說?】【非同步任務不一定要回呼函數。】【從來就沒有什麼執行棧。主線程永遠在執行中。主線程會不斷檢查事件隊列】 "任務隊列"是一個先進先出的資料結構,排在前面的事件,優先返回主線程。主線程的讀取過程基本上是自動的,只要執行棧一清空,"任務隊列"上第一位的事件就自動返回主線程。但是,由於存在後文提到的"定時器"功能,主線程要檢查一下執行時間,某些事件必須要在規定的時間返回主線程。 【先產生的事件,先被處理。永遠在主線程上,沒有返回主線程之說】【某些事件也不是必須要在規定的時間執行,有時候沒辦法在規定的時間執行】 四、Event Loop 主線程從"任務隊列"中讀取事件,這個過程是迴圈不斷的,所以整個的這種運行機制又稱為Event Loop(事件迴圈)。 【事件驅動的的實現過程主要靠事件迴圈完成。進程啟動後就進入主迴圈。主迴圈的過程就是不停的從事件隊列裡讀取事件。如果事件有關聯的handle(也就是註冊的callback),就執行handle。一個事件並不一定有callback】
為了更好地理解Event Loop,請看(轉引自Philip Roberts的演講《Help, I‘m stuck in an event-loop》)。
【所以上面的callback queue,其實是event queue】
中,主線程啟動並執行時候,產生堆(heap)和棧(stack),棧中的代碼調用各種外部API,它們在"任務隊列"中加入各種事件(click,load,done)。只要棧中的代碼執行完畢,主線程就會去讀取"任務隊列",依次執行那些事件所對應的回呼函數。
執行棧中的代碼,總是在讀取"任務隊列"之前執行。請看下面這個例子。
var req = new XMLHttpRequest(); req.open(‘GET‘, url); req.onload = function (){}; req.onerror = function (){}; req.send();
上面代碼中的req.send方法是Ajax操作向伺服器發送資料,它是一個非同步任務,意味著只有當前指令碼的所有代碼執行完,系統才會去讀取"任務隊列"。所以,它與下面的寫法等價。
var req = new XMLHttpRequest(); req.open(‘GET‘, url); req.send(); req.onload = function (){}; req.onerror = function (){};
【等價個屁。這個調用其實有個預設回呼函數,Ajax結束後,執行回呼函數,回呼函數檢查狀態,決定調用onload還是onerror。所以只要在回呼函數執行之前設定這兩個屬性就行】 也就是說,指定回呼函數的部分(onload和onerror),在send()方法的前面或後面無關緊要,因為它們屬於執行棧的一部分,系統總是執行完它們,才會去讀取"任務隊列”。 五、定時器
除了放置非同步任務,"任務隊列"還有一個作用,就是可以放置定時事件,即指定某些代碼在多少時間之後執行。這叫做"定時器"(timer)功能,也就是定時執行的代碼。
定時器功能主要由setTimeout()和setInterval()這兩個函數來完成,它們的內部運行機制完全一樣,區別在於前者指定的代碼是一次性執行,後者則為反覆執行。以下主要討論setTimeout()。
setTimeout()接受兩個參數,第一個是回呼函數,第二個是延遲執行的毫秒數。
console.log(1);setTimeout(function(){console.log(2);},1000);console.log(3);
上面代碼的執行結果是1,3,2,因為setTimeout()將第二行延遲到1000毫秒之後執行。
如果將setTimeout()的第二個參數設為0,就表示當前代碼執行完(執行棧清空)以後,立即執行(0毫秒間隔)指定的回呼函數。
setTimeout(function(){console.log(1);}, 0);console.log(2);
上面代碼的執行結果總是2,1,因為只有在執行完第二行以後,系統才會去執行"任務隊列"中的回呼函數。
HTML5標準規定了setTimeout()的第二個參數的最小值(最短間隔),不得低於4毫秒,如果低於這個值,就會自動增加。在此之前,老版本的瀏覽器都將最短間隔設為10毫秒。
另外,對於那些DOM的變動(尤其是涉及頁面重新渲染的部分),通常不會立即執行,而是每16毫秒執行一次。這時使用requestAnimationFrame()的效果要好於setTimeout()。
需要注意的是,setTimeout()只是將事件插入了"任務隊列",必須等到當前代碼(執行棧)執行完,主線程才會去執行它指定的回呼函數。要是當前代碼耗時很長,有可能要等很久,所以並沒有辦法保證,回呼函數一定會在setTimeout()指定的時間執行。 【定時器並不是特例。到達時間點後,會形成一個事件(timeout事件)。不同的是一般事件是靠底層系統或者線程池之類的產生事件,但定時器事件是靠事件迴圈不停檢查系統時間來判定是否到達時間點來產生事件】 六、Node.js的Event Loop
Node.js也是單線程的Event Loop,但是它的運行機制不同於瀏覽器環境。
請看下面的(作者@BusyRich)。
【以我對Node的瞭解,上面這個圖也是錯的。】【OS Operation不在那個位置,而是在event loop的後面。event queue在event loop中間】【js —> v8 —> node binding —> (event loop) —> worker threads/poll —> blocking operation <— <— <—— (event loop)<—————— event <——————】 根據,Node.js的運行機制如下。
(1)V8引擎解析JavaScript指令碼。
(2)解析後的代碼,調用Node API。
(3)libuv庫負責Node API的執行。它將不同的任務分配給不同的線程,形成一個Event Loop(事件迴圈),以非同步方式將任務的執行結果返回給V8引擎。
(4)V8引擎再將結果返回給使用者。
【完全不是不同的任務分配給不同的線程。只有磁碟IO操作才用到了線程池(unix)。】【Node中,磁碟I/O的非同步作業步驟如下:】【將調用封裝成中間對象,交給event loop,然後直接返回】【中間對象會被丟進線程池,等待執行】【執行完成後,會將資料放進事件隊列中,形成事件】【迴圈執行,處理事件。拿到事件的關聯函數(callback)和資料,將其執行】【然後下一個事件,繼續迴圈】 除了setTimeout和setInterval這兩個方法,Node.js還提供了另外兩個與"任務隊列"有關的方法:process.nextTick和setImmediate。它們可以協助我們加深對"任務隊列"的理解。
process.nextTick方法可以在當前"執行棧"的尾部----主線程下一次讀取"任務隊列"之前----觸發回呼函數。也就是說,它指定的任務總是發生在所有非同步任務之前。setImmediate方法則是在當前"任務隊列"的尾部觸發回呼函數,也就是說,它指定的任務總是在主線程下一次讀取"任務隊列"時執行,這與setTimeout(fn, 0)很像。請看下面的例子(via StackOverflow)。
process.nextTick(function A() { console.log(1); process.nextTick(function B(){console.log(2);});});setTimeout(function timeout() { console.log(‘TIMEOUT FIRED‘);}, 0)// 1// 2// TIMEOUT FIRED
上面代碼中,由於process.nextTick方法指定的回呼函數,總是在當前"執行棧"的尾部觸發,所以不僅函數A比setTimeout指定的回呼函數timeout先執行,而且函數B也比timeout先執行。這說明,如果有多個process.nextTick語句(不管它們是否嵌套),將全部在當前"執行棧"執行。
現在,再看setImmediate。
setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);});});setTimeout(function timeout() { console.log(‘TIMEOUT FIRED‘);}, 0)// 1// TIMEOUT FIRED// 2
上面代碼中,有兩個setImmediate。第一個setImmediate,指定在當前"任務隊列"尾部(下一次"事件迴圈"時)觸發回呼函數A;然後,setTimeout也是指定在當前"任務隊列"尾部觸發回呼函數timeout,所以輸出結果中,TIMEOUT FIRED排在1的後面。至於2排在TIMEOUT FIRED的後面,是因為setImmediate的另一個重要特點:一次"事件迴圈"只能觸發一個由setImmediate指定的回呼函數。
我們由此得到了一個重要區別:多個process.nextTick語句總是一次執行完,多個setImmediate則需要多次才能執行完。事實上,這正是Node.js 10.0版添加setImmediate方法的原因,否則像下面這樣的遞迴調用process.nextTick,將會沒完沒了,主線程根本不會去讀取"事件隊列”! 【10.0版就不用糾正了吧】
process.nextTick(function foo() { process.nextTick(foo);});
事實上,現在要是你寫出遞迴的process.nextTick,Node.js會拋出一個警告,要求你改成setImmediate。另外,由於process.nextTick指定的回呼函數是在本次"事件迴圈"觸發,而setImmediate指定的是在下次"事件迴圈"觸發,所以很顯然,前者總是比後者發生得早,而且執行效率也高(因為不用檢查"任務隊列")。
關於setImmediate與setTimeout(fn,0)的區別是,setImmediate總是在setTimeout前面執行,除了主線程第一次進入Event Loop時。請看下面的例子。
setTimeout(function () { console.log(‘1‘);},0);setImmediate(function () { console.log(‘2‘);})
上面代碼的運行結果不確定,有可能是1,2,也有可能是2,1,即使setTimeout和setImmediate兩個函數互換位置,也是如此。因為這些代碼是主線程第一次讀取Event Loop之前運行。但是,如果把這段代碼放在setImmediate之中,結果就不一樣。
setImmediate(function () { setTimeout(function () { console.log(‘1‘); },0); setImmediate(function () { console.log(‘2‘); })})
上面代碼運行結果總是2,1,因為進入Event Loop之後,setImmediate在setTimeout之前觸發。 【還是會出現1, 2的情況。呵呵。不信試試】 (完) 【準確講,使用事件驅動的系統中,必然有非常非常多的事件。如果事件都產生,都要主迴圈去處理,必然會導致主線程繁忙。那對於應用程式層的代碼而言,肯定有很多不關心的事件(比如只關心點擊事件,不關心定時器事件)。這會導致一定浪費。】【這篇文章裡沒有講到的一個重要概念是watcher。觀察者。】【事實上,不是所有的事件都放置在一個隊列裡。】【不同的事件,放置在不同的隊列。】【當我們沒有使用定時器時,則完全不用關心定時器事件這個隊列】【當我們進行定時器調用時,首先會設定一個定時器watcher。事件迴圈的過程中,會去調用該watcher,檢查它的事件隊列上是否產生事件(比對時間的方式)】【當我們進行磁碟IO的時候,則首先設定一個io watcher,磁碟IO完成後,會在該io watcher的事件隊列上添加一個事件。事件迴圈的過程中從該watcher上處理事件。處理完已有的事件後,處理下一個watcher】【檢查完所有watcher後,進入下一輪檢查】【對某類事件不關心時,則沒有相關watcher】 【最後,如有問題,謝謝指出】
【樸靈評註】JavaScript 運行機制詳解:再談Event Loop