最佳化屏障和記憶體屏障

來源:互聯網
上載者:User

轉自:http://blog.chinaunix.net/u3/93713/showart_2061476.html

 

最佳化屏障和記憶體屏障
最佳化屏障

編譯器編譯原始碼時,會將原始碼進行最佳化,將原始碼的指令進行重排序,以適合於CPU的並存執行。然而,核心同步必須避免指令重新排序,最佳化屏障(Optimization barrier)避免編譯器的重排序最佳化操作,保證編譯器時在最佳化屏障之前的指令不會在最佳化屏障之後執行。
Linux用宏barrier實現最佳化屏障,gcc編譯器的最佳化屏障宏定義列出如下(在include/linux/compiler-gcc.h中):
#define barrier() __asm__ __volatile__("": : :"memory")

上述定義中,“__asm__”表示插入了組合語言程式,“__volatile__”表示阻止編譯器對該值進行最佳化,確保變數使用了使用者定義的精確地址,而不是裝有同一資訊的一些別名。“memory”表示指令修改了記憶體單元。
記憶體屏障

軟體可通過讀寫屏障強制記憶體訪問次序。讀寫屏障像一堵牆,所有在設定讀寫屏障之前發起的記憶體訪問,必須先於在設定屏障之後發起的記憶體訪問之前完成,確保記憶體訪問按程式的順序完成。
讀寫屏障通過處理器構架的特殊指令mfence(記憶體屏障)、lfence(讀屏障)和sfence(寫屏障)完成,見《x86-64構架規範》一章。另外,在x86-64處理器中,對硬體進行操作的組合語言指令是“串列的”,也具有記憶體屏障的作用,如:對I/O連接埠進行操作的所有指令、帶lock首碼的指令以及寫控制寄存器、系統寄存器或調試寄存器的所有指令(如:cli和sti)。
Linux核心提供的記憶體屏障API函數說明如表2。記憶體屏障可用於多處理器和單一處理器系統,如果僅用於多處理器系統,就使用smp_xxx函數,在單一處理器系統上,它們什麼都不要。
表2 記憶體屏障API函數說明 記憶體屏障的宏定義  功能說明
mb()  適用於多處理器和單一處理器的記憶體屏障。
rmb()  適用於多處理器和單一處理器的讀記憶體屏障。
wmb()  適用於多處理器和單一處理器的寫記憶體屏障。
smp_mb()  適用於多處理器的記憶體屏障。
smp_rmb()  適用於多處理器的讀記憶體屏障。
smp_wmb()  適用於多處理器的寫記憶體屏障。

適合於多處理器和單一處理器的記憶體屏障宏定義列出如下(在include/asm-x86/system.h中):
#ifdef CONFIG_X86_32
/*指令“lock; addl $0,0(%%esp)”表示加鎖,把0加到棧頂的記憶體單元,該指令操作本身無意義,但這些指令起到記憶體屏障的作用,讓前面的指令執行完成。具有XMM2特徵的CPU已有記憶體屏障指令,就直接使用該指令*/
#define mb() alternative("lock; addl $0,0(%%esp)", "mfence", X86_FEATURE_XMM2)
#define rmb() alternative("lock; addl $0,0(%%esp)", "lfence", X86_FEATURE_XMM2)
#define wmb() alternative("lock; addl $0,0(%%esp)", "sfence", X86_FEATURE_XMM)
#else
#define mb() asm volatile("mfence":::"memory")
#define rmb() asm volatile("lfence":::"memory")
#define wmb() asm volatile("sfence" ::: "memory")
#endif

/*重新整理後面的讀所依賴的所有掛起讀操作,在x86-64構架上不需要*/
#define read_barrier_depends() do { } while (0)

宏定義ead_barrier_depends()重新整理後面的讀所依賴的所有掛起讀操作,後面的讀操作依賴於正處理的讀操作返回的資料。在x86-64構架上不需要此宏。它表明:在此屏障之前,沒有來自記憶體地區資料所依賴的讀曾經重排序。所有的讀操作處理此原語,保證在跟隨此原語的任何讀操作此原語之前訪問記憶體(但不需要其他CPU的cache)。此原語在大多數CPU上有比rmb()更輕的份量。
本地CPU和編譯器遵循記憶體屏障的排序限制,僅記憶體屏障原語保證排序,即使資料有依賴關係,也不能保證排序。例如:下面代碼將強迫排序,因為*q的讀操作依賴於p的讀操作,並且這兩個讀操作被read_barrier_depends()分開。在CPU 0和CPU 1上執行的程式語句分別列出如下:

CPU 0                                      CPU 1
b = 2;
memory_barrier();
p = &b;                                      q = p;
                                                read_barrier_depends();
                                                d = *q;

下面的代碼沒有強制排序,因為在a和b的讀操作之間沒有依賴關係,因此,在一些CPU上,如:Alpha,y將設定為3,x設定為0。類似這種沒有資料依賴關係的讀操作,需要排序應使用rmb()。

CPU 0                                        CPU 1

a = 2;
memory_barrier();
b = 3;                                         y = b;
                                                 read_barrier_depends();
                                                 x = a;

適合於多處理器的記憶體屏障宏定義列出如下(在include/asm-x86/system.h中):
#ifdef CONFIG_SMP
#define smp_mb() mb()
#ifdef CONFIG_X86_PPRO_FENCE
# define smp_rmb() rmb()
#else
# define smp_rmb() barrier()
#endif
#ifdef CONFIG_X86_OOSTORE
# define smp_wmb() wmb()
#else
# define smp_wmb() barrier()
#endif
#define smp_read_barrier_depends() read_barrier_depends()
#define set_mb(var, value) do { (void)xchg(&var, value); } while (0)
#else
#define smp_mb() barrier()
#define smp_rmb() barrier()
#define smp_wmb() barrier()
#define smp_read_barrier_depends() do { } while (0)
#define set_mb(var, value) do { var = value; barrier(); } while (0)
#endif

函數rdtsc_barrier用於加記憶體屏障阻止RDTSC猜測,當在一個定義的代碼地區使用讀取時間戳記計數器(Read Time-Stamp Counter,RDTSC)函數(或者函數get_cycles或vread)時,必須加記憶體屏障阻止RDTSC猜測。其列出如下:

static inline void rdtsc_barrier(void)
{
    alternative(ASM_NOP3, "mfence", X86_FEATURE_MFENCE_RDTSC);
    alternative(ASM_NOP3, "lfence", X86_FEATURE_LFENCE_RDTSC);

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.