Topic Center

Contact Sales

首頁 > 開發者 > C++

C中實現矩陣乘法的一種高效的方法

最後更新：2018-12-08 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

如何計算矩陣乘法，這個大家都知道。通常情況下，我們都是用以下代碼實現的：

複製代碼代碼如下:for(i=0;i<n;++i)
for(j=0;j<n;++j){
sum=0;
for(k=0;k<n;++k)
sum+=A[i][k]*B[k][j];
C[i][j]+=sum;
}

但是考慮了快取的問題後，其實有一種更好的實現方式：複製代碼代碼如下:

for(i=0;i<n;++i)
for(k=0;k<n;++k){
r=A[i][k];
for(j=0;j<n;++j)
C[i][j]+=r*B[k][j];
}

細看一番就會發現這兩種實現語義是等價的，但是後者的實際運行效率卻比前者高。

那為什麼會如此呢？

那是因為CPU讀資料時，並不是直接存取記憶體，而是先查看緩衝中是否有資料，有的話直接從緩衝讀取。而從緩衝讀取資料比從記憶體讀資料快很多。

當資料不在緩衝中時，CPU會將包含資料在內的一個資料區塊讀到緩衝，如果程式具有良好空間局部性，那麼第一次cache miss後，之後的幾次資料訪問就可以直接在緩衝中完成。除了空間局部性（程式傾向於引用與當前資料鄰近的資料）之外，還有時間局部性（程式傾向於引用最近被引用過的資料）。

回到矩陣乘法。（我們只考慮內迴圈）

前者對矩陣A，有良好的空間局部性，假設一次能緩衝四個元素，則每次迭代對於A只有0.25次miss，但是對於B，則不然，因此B是按列訪問的，每次訪問都會miss，因此每次迭代總的miss數是1.25。

後者對於矩陣C和矩陣B都有良好的局部性，每次迭代都只有0.25詞miss，因此總的miss數是0.5。後者每次迭代多了一次儲存（對C[i][j]寫入），但是即便如此，後者的運行效率也比前者高。

總而言之，要想程式跑得快，就要在程式中多利用局部性，讓緩衝hold住你的資料，減少訪存次數。要知道CPU可以在3個刻度內訪問到L1 cache，10個刻度左右的時間訪問到L2 cache。訪問記憶體卻要上百個刻度，孰快孰慢，很清楚了吧？

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

相關關鍵詞：

c sharp vs c c c tablet c c bank c c garbage disposal botnet c c list c c financial services gnu c c compiler

一分鐘學會 log4net（c#）配置及使用 07-17

C# 定時執行一個方法 07-17

c語言實現排列組合演算法問題 07-18

各大微博短網址(ShortUrl)的演算法 C# 12-05

C#操作INI檔案(調用WindowsAPI函數:WritePrivateProfileString,GetPrivate... 12-07

C#全形和半形轉換 12-07

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

C中實現矩陣乘法的一種高效的方法

聯繫我們

熱門內容

熱門主題

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support