“memory”比較特殊,可能是內嵌彙編中最難懂部分。為解釋清楚它,先介紹一下編譯器的最佳化知識,再看C關鍵字volatile。最後去看該描述符。
1、編譯器最佳化介紹
記憶體訪問速度遠不及CPU處理速度,為提高機器整體效能,在硬體上引入硬體快取Cache,加速對記憶體的訪問。另外在現代CPU中指令的執行並不一定嚴格按照順序執行,沒有相關性的指令可以亂序執行,以充分利用CPU的指令流水線,提高執行速度。以上是硬體層級的最佳化。再看軟體一級的最佳化:一種是在編寫代碼時由程式員最佳化,另一種是由編譯器進行最佳化。編譯器最佳化常用的方法有:將記憶體變數緩衝到寄存器;調整指令順序充分利用CPU指令流水線,常見的是重新排序讀寫指令。對常規記憶體進行最佳化的時候,這些最佳化是透明的,而且效率很好。由編譯器最佳化或者硬體重新排序引起的問題的解決辦法是在從硬體(或者其他處理器)的角度看必須以特定順序執行的操作之間設定記憶體屏障(memory barrier),linux 提供了一個宏解決編譯器的執行順序問題。
void Barrier(void)
這個函數通知編譯器插入一個記憶體屏障,但對硬體無效,編譯後的代碼會把當前CPU寄存器中的所有修改過的數值存入記憶體,需要這些資料的時候再重新從記憶體中讀出。
2、C語言關鍵字volatile
C語言關鍵字volatile(注意它是用來修飾變數而不是上面介紹的__volatile__)表明某個變數的值可能在外部被改變,因此對這些變數的存取不能緩衝到寄存器,每次使用時需要重新存取。該關鍵字在多線程環境下經常使用,因為在編寫多線程的程式時,同一個變數可能被多個線程修改,而程式通過該變數同步各個線程,例如:
DWORD __stdcall threadFunc(LPVOID signal)
{
int* intSignal=reinterpret_cast<int*>(signal);
*intSignal=2;
while(*intSignal!=1)
sleep(1000);
return 0;
}
該線程啟動時將intSignal 置為2,然後迴圈等待直到intSignal 為1 時退出。顯然intSignal的值必須在外部被改變,否則該線程不會退出。但是實際啟動並執行時候該線程卻不會退出,即使在外部將它的值改為1,看一下對應的偽彙編代碼就明白了:
mov ax,signal
label:
if(ax!=1)
goto label
對於C編譯器來說,它並不知道這個值會被其他線程修改。自然就把它cache在寄存器裡面。記住,C 編譯器是沒有線程概念的!這時候就需要用到volatile。volatile 的本意是指:這個值可能會在當前線程外部被改變。也就是說,我們要在threadFunc中的intSignal前面加上volatile關鍵字,這時候,編譯器知道該變數的值會在外部改變,因此每次訪問該變數時會重新讀取,所作的迴圈變為如下面偽碼所示:
label:
mov ax,signal
if(ax!=1)
goto label
3、Memory
有了上面的知識就不難理解Memory修改描述符了,Memory描述符告知GCC:
1)不要將該段內嵌彙編指令與前面的指令重新排序;也就是在執行內嵌彙編代碼之前,它前面的指令都執行完畢
2)不要將變數緩衝到寄存器,因為這段代碼可能會用到記憶體變數,而這些記憶體變數會以不可預知的方式發生改變,因此GCC插入必要的代碼先將緩衝到寄存器的變數值寫回記憶體,如果後面又訪問這些變數,需要重新訪問記憶體。
如果彙編指令修改了記憶體,但是GCC 本身卻察覺不到,因為在輸出部分沒有描述,此時就需要在修改描述部分增加“memory”,告訴GCC 記憶體已經被修改,GCC 得知這個資訊後,就會在這段指令之前,插入必要的指令將前面因為最佳化Cache 到寄存器中的變數值先寫回記憶體,如果以後又要使用這些變數再重新讀取。
使用“volatile”也可以達到這個目的,但是我們在每個變數前增加該關鍵字,不如使用“memory”方便。