H.264/MPEG-4 Part 10 White Paper 譯 (一 H.264概覽、二 Intra Prediction)

最後更新：2018-12-05 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

H.264/MPEG-4 Part 10 White Paper

H.264概覽

1. 引言

數字電視和DVD-video的出現使得廣播電視和家庭娛樂發生了徹底的變革.越來越多的這些應用成為可能隨著視頻壓縮技術的標準化.MPGE系列的下一個標準,MPEG4,正使得新一代的基於網際網路的視頻應用成為可能.而現在視頻壓縮的ITU-T H.263標準被廣泛的應用於視頻會議系統．

MPEG4(視頻)和H.263都是基於視頻壓縮(視頻編碼)技術的標準(大約從1995年開始).MPEG 格式和視頻編碼專家組(MPEG和VCEG)致力於開發一個比MPEG4和H.263有更好效能的新標準,有著高品質,低位元視頻流的特性一個更好的視頻映像壓縮方法.新標準"進階視頻編碼"(AVC)的曆史可追溯到7年前.

1995年,為了通過電話線傳輸視頻訊號而制定的H.263標準定稿以後.ITU-T視頻編碼專家組(VCEG)就開始工作在兩個更深入的發展領域:一個是"短期"的努力去增加H.263的額外特性(制定出標準的版本2),還有一個"長期"的努力,去開發一個適用於低比低率下可視通訊的新標準,提供比之前的ITU-T標準更有效,明顯更好的視頻壓縮方法.2001年,ISOMPEG 格式(MPEG)意識到H.26L的潛在優點,就組成了視頻聯合工作群組(JVT),包括MPEG和VCEG的的專家.JVT的主要任務就是將H.26L"模式"草案發展成為一個完全的國際標準.實際上,結果產生了兩個標準:ISO MPEG4第10部分和ITU-T H.264. 新標準的官方命名是"進階視頻編碼"(AVC);然而,舊的命名H.26L和以ITU文檔號命名的IH.264[1]更廣為人知.

2. H.264 轉碼器

和之前的標準一樣(如MPEG1,MPEG2和MPEG4),H.264標準草案並沒有明確定義一個轉碼器.在一定程度上,標準定義了視頻位元流編碼和與之相對應的解碼方法的文法.然而實際上,一個符合的編碼和解碼器一般包括Figure 2-1 和Figure 2-2中所示的功能模組.同時這些圖中所示功能通常是必須的,但轉碼器還是可以有相當多的變種.基本的功能模組(預測,傳輸,量化,熵編碼)與之前的標準(MPEG1,MPEG2,MPEG4,H.261,H.263)差不多.H.264的最重要的變化是在這些功能模組的實現細節上.

編碼器包括兩個資料流路徑.一個"前向"路徑(從左至右,以藍色表示)和一個"重構"路徑(從右至左,以洋紅色表示).解碼器的資料流路徑以從右至左的方式表示,以此來說明編碼器和解碼器之間的相同點.

2.1 編碼器（前向路徑）

當一個輸入幀Fn被提交編碼。該幀以宏塊（相當於16X16像素的原始映像）為單位來進行處理。每個宏塊被編碼成幀內模式或幀間模式。在這兩種情況下，會產生一個基於重建幀的預測宏塊P。在幀內模式下，P根據之前已經編碼，解碼，重建的當前幀n中的採樣產生（圖中以uF’n表示。注意是未經過濾的採樣用來產生P）。在幀間模式下，P根據採用一個或多個參考幀的運動補償預測來產生。在圖中，參考幀表示為之前已經編碼的幀F’n-1；然而，每個宏塊的預測可能根據過去或將來（以時間為序）的一或多個已經編碼並重構的幀來產生。

預測P被從當前宏塊中減去來產生一個殘留的或差異宏塊Dn。它以量化變換係數集X變換（使用塊變換）並量化.這些係數被重新排序並進行熵編碼。在宏塊解碼時需要的熵編碼係數和邊資訊（如宏塊預測模式，量化步長，描述宏塊如何運動補償的運動向量等等）組成了壓縮的位元流。它被傳輸到了網路抽象層（NAL）進行傳輸或儲存。

2.2 編碼器（重建路徑）

為了編碼更進一步的宏塊，需通過解碼宏塊量化係數X來重建一幀。係數X被重新調整（Q-1)並且進行逆變換（T-1）來產生一個不同的宏塊Dn’，這與原始的差異宏塊Dn不同；它在量化過程中有了損耗，所以Dn’是Dn的一個失真版本。

預測宏塊P被加到Dn’中來建立一個重建宏塊uF’n（原始宏塊的一個失真版本）。為了減少阻斷失真的影響使用了一個濾鏡，重建參考幀從一系列的宏塊F’n中建立。

2.3 解碼器

解碼器從NAL（網路抽象層）接收壓縮的位元流。資料元素被熵解碼並且重新排列來產生一個量化係數集X。它們被重新調整並進行逆轉換來產生Dn’（與編碼器中所示的Dn’相同）。使用位元流中解碼出的頭部資訊，解碼器產生一個預測宏塊P，與在編碼器中產生的原始預測幀P相同。P被加到Dn’中來產生uFn’，uF’n經過過濾產生瞭解碼的宏塊Fn’。

編碼器的重建路徑應該從圖示和上面的討論中清除，它實際上是為了確保編碼器和解碼器使用相同的參考幀來產生預測幀P。如果不這樣做，編碼器和解碼器中的預測幀P就不會相同，導致編碼器和解碼器之間存在一個越來越大的誤差或是“位移”。

3．參考資料

1 ITU-T Rec. H.264 / ISO/IEC 11496-10, “Advanced Video Coding”, Final Committee Draft, Document JVTE022,September 2002

H.264/MPEG-4 Part 10 White Paper 譯(二) Intra Prediction

幀內宏塊預測

1．引言

聯合視頻工作群組（JVT）正在定案一個新的自然視頻映像編碼（壓縮）標準。新標準被稱為H.264或稱作MPEG-4 Part 10、“進階視頻編碼（AVS）”。這篇文檔描述了H.264轉碼器中宏塊幀內編碼的方法。

如果一個塊或宏塊按幀內模式編碼，會基於之前已經編碼並重構（未過濾）的塊產生一個預測宏塊。這個預測塊P被從之前已經編碼的當前宏塊中減去。對於亮度（luma）採樣，P可能為每個4X4子塊或16X16宏塊產生。對於每個4X4的亮度塊總共有9種可選的預測模式；對於16X16亮度塊有4種可供選擇的模式；而每個4X4的色度塊只有一種預測模式（註：此處當理解成只有一種8X8的色度分塊模式？）。

2．4X4亮度塊預測模式

Figure 1顯示在一個QCIF幀中的一個亮度宏塊和一個需要進行預測的4X4的亮度塊。該塊左邊和上邊的採樣（即像素對應值）已經被編碼、重建並且因而能夠在編碼器和解碼器中用來產生預測塊。基於Figure 2中標識為A-M的採樣計算出預測塊P。注意在有些情況下，不是所有的採樣A-M都在當前切片（即分塊）中可用：為了保持切片解碼的獨立性，只有在當前切片中可用的採樣才會用來進行預測。直流(DC)預測（模式2）根據A-M中的哪些採樣可用來修改；其它模式（1-8）或許只能使用在所有預測中用到的採樣都可用的情況（除了E，F，G，H停用情況。這些值可從D中複製）。

Figure 3中的箭頭標出了每種模式下預測的方向。在模式3-8中，預測值根據預測採樣A-Q的加權平均來產生。編碼器可能為每個塊選擇一種預測模式來減小P和被編碼塊之間的誤差。

例：對Figure 1中所示的4X4塊使用9種預測模式（0-8）計算。Figure 4顯示了每種預測產生的預測塊P。每種預測模式的絕對誤差和（SAE）表明了預測誤差的規模。在這種例子中，與實際當前塊匹配最好的是模式7(垂直向左)，因為這種模式給出了最小的SAE；經過視覺上的比較可以看出P塊與原始的4X4塊非常相似。

3． 16X16亮度塊預測模式

16X16亮度塊預測模式是一個上述4X4亮度塊預測模式的一種替代方法，整個16X16的亮度塊可以被預測。有四種模式可以使用。如Figure 5所示：

模式0(垂直)：從塊上部的採樣推出（H）。

模式1(水平)：從塊左側的採樣推出（V）。

模式2(直流)：從塊上部和左側的採樣的均值推出（H+V）

模式3(平面)：對塊上部和左側的採樣H和V使用一個線性“平面”函數，這在平滑的亮度地區中效果最好。

例：

Figure 6 顯示了一個左側和上部採樣已經編碼的亮度宏塊。預測結果（Figure 7）表明首選由模式3給出。幀內16X16模式在分布均勻的映像地區中效果比較好。

4． 8X8色度塊預測模式

一個宏塊的每個8X8的色度分量從之前已編碼重構的上部和（或）左側的色度採樣中預測。色度塊的四種預測模式和第3部分中描述（Figure 5所示）的16X16亮度塊預測模式非常相似，除了模式號不同：直流（模式0），橫向（模式1），垂直（模式2）和平面（模式3）。相同的預測模式在色度塊中也始終適用（色度和亮度的相同預測模式的預測方法相同）。

注意：如果亮度分量中的8X8塊被編碼成幀內預測模式，色度塊也要編碼成幀內預測模式。

5．幀內預測模式編碼

每個4X4塊所選擇的幀內預測模式必須傳遞給解碼器，這就要求一個大量的位來儲存。然而，相鄰4X4塊幀內預測模式高度相關。例如，如果Figure 8中的之前已經編碼的4X4塊A和B使用模式2，很可能塊C（當前編碼塊）的最佳預測模式也是模式2。

對每個當前塊C，編碼器和解碼器計算出最可能模式（most_probable_mode）.如果A和B都使用了4X4幀內預測模式並且都包含在當前切片中，最可能模式就是A和B中模式號最小的預測模式；否則最可能模式設定為2(直流預測)。

編碼器給每個4X4塊發送標誌use_most_probable_mode，如果標誌為”1”，參數most_probable_mode被使用。如果標誌為”0”，另一個參數remaining_mode_selector被發送，表明需改變模式。如果remaining_mode_selector比當前most_probable_mode小，預測模式就設定成remaining_mode_selector; 否則預測模式設定成remaining_mode_selector+1.採用這種方法，remaining_mode_selector只需使用8個值（0到7）來標誌當前幀內預測模式（0到8）。

6．參考資料

1 ITU-T Rec. H.264 / ISO/IEC 11496-10, “Advanced Video Coding”, Final Committee Draft, Document JVTF100,December 2002

2 Iain E G Richardson, “H.264 and MPEG-4 Video Compression”, John Wiley & Sons, to be published late 2003

轉載地址：http://hi.baidu.com/huybin%5Fwang/blog/item/a0f6b0b400f2e1758bd4b2d7.html

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

H.264/MPEG-4 Part 10 White Paper 譯 (一 H.264概覽、二 Intra Prediction)

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support