h.264 率失真最佳化

最後更新：2018-12-05 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

在H.264中率失真最佳化有很重要的作用。
RDO對應的公式：J(mode)＝SSD＋λ*R(ref,mode,mv,residual)
SSD是指重建塊與源映像的差值均方和；λ是拉格朗日乘子；
R就是該模式下宏塊編碼的實際碼流，包括對參考幀、模式、運動向量、殘差等的位元速率。
當然如果是幀內模式，就只有R(mode,residual)。
但是因為SSD需要重建映像，必然涉及到變換量化、熵編碼、反變換反量化、重建等，計算量是相當大的
所以出現替代公式：
J(mode)＝SAD＋λ*R(ref,mode,mv)

J(mode)＝SATD＋λ*R(ref,mode,mv)
SAD就是該模式下預測塊與源映像的絕對誤差和。
SATD:殘差經哈德曼變換的4×4塊的預測殘差絕對值總和,所以satd也在一定程度上反應了殘差位元速率。因此在替代公式R計算時也忽略了residual。

for (j=0;j<16;j)
   {
       for (i=0;i<16;i)
       {
      M1[ i ][j]=imgY_org[img->opix_y+j][img->opix_x+i]-img->mprr_2[k][j][ i ];       計算當前宏塊殘差塊
      M0[i%4][i/4][j%4][j/4]=M1[ i ][j];
       }
   }
   current_intra_sad_2=0;              // no SAD

start handicap here
   for (jj=0;jj<4;jj)
   {
       for (ii=0;ii<4;ii)
       {
      for (j=0;j<4;j)                                                       第一次一維Hadamard變換

      {
         M3[0]=M0[0][ii][j][jj]+M0[3][ii][j][jj];
         M3[1]=M0[1][ii][j][jj]+M0[2][ii][j][jj];
         M3[2]=M0[1][ii][j][jj]-M0[2][ii][j][jj];
         M3[3]=M0[0][ii][j][jj]-M0[3][ii][j][jj];


         M0[0][ii][j][jj]=M3[0]+M3[1];
         M0[2][ii][j][jj]=M3[0]-M3[1];
         M0[1][ii][j][jj]=M3[2]+M3[3];
         M0[3][ii][j][jj]=M3[3]-M3[2];
      }

      for (i=0;i<4;i)
      {

         M3[0]=M0[ i ][ii][0][jj]+M0[ i ][ii][3][jj];
         M3[1]=M0[ i ][ii][1][jj]+M0[ i ][ii][2][jj];
         M3[2]=M0[ i ][ii][1][jj]-M0[ i ][ii][2][jj];
         M3[3]=M0[ i ][ii][0][jj]-M0[ i ][ii][3][jj];

                                                第二次一維Hadamard變換

         M0[ i ][ii][0][jj]=M3[0]+M3[1];
         M0[ i ][ii][2][jj]=M3[0]-M3[1];
         M0[ i ][ii][1][jj]=M3[2]+M3[3];
         M0[ i ][ii][3][jj]=M3[3]-M3[2];
         for (j=0;j<4;j)
             if ((i+j)!=0)
            current_intra_sad_2 += abs(M0[ i ][ii][j][jj]);       變換後的AC殘差值取絕對值求和作為代價

      }

       }
   }

   for (j=0;j<4;j)
       for (i=0;i<4;i)
      M4[ i ][j]=M0[0][ i ][0][j]/4;

       // Hadamard of DC koeff
       for (j=0;j<4;j)       後面兩個for迴圈對當前宏塊的DC殘差進行Hadamard變換並將變換後的值取絕對值
求和作為代價
       {
      M3[0]=M4[0][j]+M4[3][j];
      M3[1]=M4[1][j]+M4[2][j];
      M3[2]=M4[1][j]-M4[2][j];
      M3[3]=M4[0][j]-M4[3][j];

      M4[0][j]=M3[0]+M3[1];
      M4[2][j]=M3[0]-M3[1];
      M4[1][j]=M3[2]+M3[3];
      M4[3][j]=M3[3]-M3[2];
       }

       for (i=0;i<4;i)
       {
      M3[0]=M4[ i ][0]+M4[ i ][3];
      M3[1]=M4[ i ][1]+M4[ i ][2];
      M3[2]=M4[ i ][1]-M4[ i ][2];
      M3[3]=M4[ i ][0]-M4[ i ][3];

      M4[ i ][0]=M3[0]+M3[1];
      M4[ i ][2]=M3[0]-M3[1];
      M4[ i ][1]=M3[2]+M3[3];
      M4[ i ][3]=M3[3]-M3[2];

      for (j=0;j<4;j)
         current_intra_sad_2 += abs(M4[ i ][j]);
       }
       if(current_intra_sad_2 < best_intra_sad2)
       {
      best_intra_sad2=current_intra_sad_2;
      *intra_mode = k; // update best intra mode

       }
}
   }
   best_intra_sad2 = best_intra_sad2/2;

return best_intra_sad2;
}

以上是來源程式裡的一段，intra_16*16並不是計算SAD

值，而是計算SATD。
其中M1中放的是宏塊的殘差，M0也是，不過為了下面計算HADAMARD變換方便，他表示成M0[4][4][4][4]的形式，前2個[4][4]表示8X8塊座標，後2個[4][4]表示一個8X8裡的4X4塊座標。
程式先對殘差進行HADAMARD變換，然後把所有的DC分量提出來，再對DC分量做HADAMARD變換，
最後得到的是SATD。
有兩點不明白，誰知道的解釋一下：
1 在提取DC分量時為什麼要除以4？
2 最後的best_intra_sad2 為什麼要除以2？

這主要是由於SATD變換不是歸一化矩陣，變換後的係數值幅值增加，因此要相應的/2和/4

hadamard 變換本身就有一個 /2 的操作，因此每次變換都要對所有係數進行 /2。而 find_sad_16x16 函數執行了兩次
hadamard 變換：首先對 256 個係數進行一次，其次對所有 DC 係數再做一次，因此對 DC 係數應該 /4，而對 AC 係數應該
/2。find_sad_16x16 函數中的：M4[ i ][j]=M0[0][ i ][0][j]/4;就是對 DC 係數
/4，而最後的：best_intra_sad2 = best_intra_sad2/2;可以認為是對 AC 係數的變相
/2。但這裡相當於是對所有係數 /2，所以 DC 係數多了一次 /2。這個多的一次就不知道原因了。

264樂園群裡探討過這個問題。對於hadamard變換的/2已經有了結論。但是對DC係數多除的那一次2，目前尚未找到根據。
4階hadamard變換的定義式本身就是包含了這個/2的。可以見http://en.wikipedia.org/wiki/Hadamard_transform
。這裡再多解釋一點
假設hadamard變換沒有/2, 變換矩陣為：
1   1   1   1
1 -1   1 -1
1   1 -1 -1
1 -1 -1   1
這時對一個列向量v = (1, 1, 1, 1)'做變換，即用變換矩陣左乘列向量v，得到的變換後向量v' = (4, 0, 0, 0)'。

現在觀察v和v'，在歐氏空間中，對一個向量的“大小”的衡量就是其長度，通過計算內積得到。那麼
len(v) = sqrt( 1^2 + 1^2 + 1^2 + 1^2) = 2
len(v') = sqrt( 4^2 + 0^2 + 0^2 + 0^2) = 4
由此可見如果沒有那個/2，變換前後，該向量的長度發生了變化。這樣的變換是違背正交變換的定義的。

所以，作為正交變換的hadamard變換，必須要有這個/2的歸一化。

A:推而廣之，整數 DCT 變換在變換前後向量的長度也發生了變化，為什麼沒有除以 2 呢？

DCT變換（非整數）也是歸一化的整數變換也是正交變換，所以也一定會滿足歸一化的。firstime是不是忘記把scaling matrix考慮進來了啊。

按照畢厚傑書上 113 頁，變換矩陣為公式 6.15（這個時候 scaling matrix 還沒分離出來吧？）：
a   a   a   a
b   c -c -b
a -a -a   a
c -b   b -c
其中 a = 1/2，b = (2/5)^0.5。這個矩陣對列向量v = (1, 1, 1, 1)'做變換前後的向量長度並不相等啊

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

h.264 率失真最佳化

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support