iOS音頻技術的研究-音頻格式

來源:互聯網
上載者:User

標籤:

**什麼是音頻格式**

這個問題我也是查了很久才弄明白的。音頻格式其實是指容器的類型,在通俗一點就是音效檔的類型,比如說“我愛你中國.mp3”,這個音效檔的音頻格式就是MP3。
這裡稍微引入一些音頻編碼的東西。很多第一次涉及這個領域的(比如說我哈),很容易弄不清音頻格式和音頻編碼的區別和聯絡,比如音頻格式中有MP3格式,音頻編碼中有MP3編碼,這時候多數人就不明白了。
音頻編碼本質是一種演算法,我們拿到聲音的未經處理資料之後,總不能直接就放到檔案中用,我們需要根據不同的用途對於這些資料進行處理,比如壓縮使其體積變小,這時候就要用到音頻編碼了。音頻編碼就是人們為了各種需要設計的演算法。
資料準備好了,需要把資料儲存至檔案中才能長久儲存。在儲存聲音資料的同時,可能出於某些需要,還會同時儲存一些其他的資料,甚至是指令碼。於是,音樂檔案成為了一種混合體。為了能讓播放器知道這個音效檔都混合了什麼,於是需要賦予它特定的音頻格式。
所以說音頻格式和音頻編碼不同。

**特點**

要在電腦內播放或是處理音頻檔案,也就是要對音效檔進行數、模轉換,這個過程同樣由採樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻檔案格式的最大頻寬是20KHZ,故而採樣速率需要介於40~50KHZ之間,而且對每個樣本需要更多的量化位元數。音頻數字化的標準是每個樣本16位-96dB的信噪比,採用線性脈衝編碼調製PCM,每一量化步長都具有相等的長度。在音頻檔案的製作中,正是採用這一標準。

**分類**

音頻格式一般可以分為兩大類:

一、原聲(非壓縮)

目前存在多種非壓縮資料格式,最流行的是WAV格式。WAV檔案的格式靈活,可以儲存多種類型的音頻資料。對於儲存原始的錄音資料是一個好的選擇。WAV格式是基於RIFF檔案格式,RIFF格式與AIFF和IFF格式類似。
BWF(廣播聲波格式)作為WAV的後繼者,是由歐洲廣播聯盟建立的一種標準音頻格式。BWF檔案中可以存放中繼資料。BWF檔案也是也是基於RIFF檔案格式的,副檔名是WAV。(僅在wiki上有提到,但是已經無從尋找)

二、壓縮

壓縮類又可以分為兩小類:
1、無損,例如APE ,FLAC,TAK,TTA ,WV,LPAC ,AU,ALAC
2、有損,例如MP3,RealAudio,OGG,VQF,WMA,ATRAC ,Musepack ,AAC,AMR
有損檔案格式是基於聲學心理學的模型,除去人類很難或根本聽不到的聲音,例如:一個音量很高的聲音後面緊跟著一個音量很低的聲音。

**常見格式**

原聲——————————————————————————————
CD
CD格式的音質是比較高的音頻格式。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數播放軟體的“開啟檔案類型”中,都可以看到.cda格式,這就是CD音軌了。標準CD格式也就是44.1K的採樣頻率,速率88K/秒,16位量化位元,因為CD音軌可以說是近似無損的,因此它的聲音基本上是忠於原聲的。CD光碟片可以在CD唱機中播放,也能用電腦裡的各種播放軟體來重放。一個CD音頻檔案是一個.cda檔案,這隻是一個索引資訊,並不是真正的包含聲音資訊,所以不論CD音樂的長短,在電腦上看到的“*.cda檔案”都是44位元組長。
WAVE
WAVE(.WAV)是微軟和IBM開發的一種音效檔格式,它符合PIFFResource Interchange File Format 檔案規格,用於儲存WINDOWS平台的音頻資訊資源,被WINDOWS平台及其應用程式所支援。“.WAV”格式支援MSADPCM、CCITT A LAW等多種壓縮演算法,支援多種音頻位元、採樣頻率和聲道,標準格式的WAV檔案和CD格式一樣,也是44.1K的採樣頻率,速率88K/秒,16位量化位元,看到了吧,WAV格式的音效檔品質和CD相差無幾,也是目前PC機上廣為流行的音效檔格式,幾乎所有的音頻編輯軟體都“認識”WAV格式。
AIFF
AIFF(Audio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟體中也都支援它們這幾種常見的音樂格式。AIFF是音頻分頁檔格式的英文縮寫。是APPLE公司開發的一種音頻檔案格式,被Mac平台及其應用程式所支援,NETSCAPE瀏覽器中LiveAudio也支援AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標準音頻格式,屬於QuickTime技術的一部分。這一格式的特點就是格式本身與資料的意義無關,因此受到了Microsoft的青睞,並據此搞出來WAV格式。AIFF雖然是一種很優秀的檔案格式,但由於它是蘋果電腦上的格式,因此在PC平台上並沒有得到很大的流行。不過由於Apple電腦多用於多媒體製作出版行業,因此幾乎所有的音頻編輯軟體和播放軟體都或多或少地支援AIFF格式。只要蘋果電腦還在,AIFF就始終還佔有一席之地。由於AIFF的包容特性,所以它支援許多壓縮技術。
無損壓縮————————————————————————————–
APE
APE(Monkey’s Audio),是一種常見的無損音頻壓縮編碼格式,副檔名為.ape,有時也採用.MAC的副檔名。在壓縮CD音頻時,一個典型的Monkey’s Audio檔案往往有接近600~700K Bit/sec,而MP3最高不會超過320K Bit/sec,一般情況下使用者只會指定到128~192K Bit/sec。
APE檔案結構是由Monkey’s Audio定義的。Monkey’s Audio提供軟體進行與其它音頻檔案格式的轉換。Monkey’s Audio是壓縮/解壓縮APE檔案的軟體。因其主介面上有個猴子圖樣而得名。Monkey’s Audio是壓縮APE格式的重要工具;也可以對APE檔案進行解壓縮。
特點:
1、壓縮率:壓縮比率一般在55%左右
2、編解碼:編碼、解碼速度略慢,配置低的電腦會有卡頓
3、錯誤處理:沒有提供錯誤處理的功能,若發生檔案損壞,損壞位置之後的資料有可能會丟失
4、音質:在音質上,相對於WMA、MP3、AAC等有損資料壓縮的格式有著絕對的優勢
5、採樣率:
6、解析度:
7、開源性:Monkey’s Audio是開放原始碼的免費軟體,授權協議並非自由軟體而是准自由軟體(Semi-free Software)而受到排擠,許多基於GNU/Linux的Linux發行包或是其他只能基於自由軟體的作業系統不能將其收入
8、其他:硬體支援
FLAC
FLAC (Free Lossless Audio Codec),中文直譯為自由無損音頻壓縮編碼(註:這裡“Free”指的是自由而並不是免費)。FLAC是一款著名的自由音頻壓縮編碼,其特點是可以對音頻檔案無損壓縮。不同於其他有損壓縮編碼如MP3及WMA(9.0版本支援無損壓縮),它不會破壞任何原有的音頻資訊,所以可以還原音樂光碟片音質。
特點:
1、壓縮率:壓縮率稍有不及APE
2、編解碼:技術更先進,佔用資源更低,解碼速度較APE更快
3、錯誤處理:只支援定點取樣,並不支援浮點取樣,確保沒有任何約數錯誤以致影響音質。當資料流損壞時,資料損失會被限制在受損的資料幀之內,一般只會丟失很短的一個片段。
4、音質:同APE
5、採樣率:支援任何採樣率,由1Hz至655,350Hz不等,並可逐1Hz微調
6、位元速率:支援任何PCM位解析度,由4至32bit皆有
7、開源性:支援大多數的Unix-like系統(包括Linux,BSD,Solaris及Mac OS X),Windows,BeOS及OS/2
8、其他:硬體支援
TAK
TAK(Tom’s lossless Audio Kompressor)是一種無損音質的音樂轉碼器。不過就目前來說,支援的軟體極少,僅有像是foobar2000與Winamp等知名音樂播放軟體配合使用外掛程式才能播放。
特點:
1、壓縮率:近似於APE的高壓縮比
2、編解碼:接近FLAC的編碼、解碼速度,支援多線程的編碼(1.0.3以後的版本)
3、錯誤處理:具有錯誤容忍(單一bit的錯誤不會影響超過250ms),具有錯誤偵測(每個frame具有一個24-bit的CRC)
4、音質:同APE
5、採樣率:支援最高192khz
6、位元速率:支援最高24bit
7、開源性:尚未開放原始碼(未來預定以C++開放原始碼)。雖然原作者尚未公開原始碼,但FFmpeg開發人員已通過反向工程實現了一個開源的TAK解碼器,並已入到FFmpeg中
8、其他:支援APEv2標籤,支援流媒體
TTA
TTA(True Audio)是一種自由又簡單的即時無損音訊轉碼器。TTA是一種基於自適應預測過濾的無損音頻壓縮,與目前主要的其他格式相比,能有相同或更好的壓縮效果。
特點:
1、壓縮率:可將資料壓縮至30%-70%
2、編解碼:即時編碼、解碼演算法,操作快捷、對系統要求低
3、錯誤處理:
4、音質:同APE
5、採樣率:
6、位元速率:8bit、16bit、24bit整型和32bitIEEE浮點型的WAV格式音頻檔案
7、開源性:支援多平台自由軟體和開放原始碼
8、其他:硬體支援,支援ID3v1和ID3v2兩種標籤資訊
WV
WV(WavPack)是由 David Bryant 開發的一個自由、開放原始碼的無損音頻壓縮格式,其檔案的尾碼名為.wv。
WavPack 引入了一種獨特的“混合”模式,它使用一個附加的檔案從而也具有了有損壓縮的優點。與其它方法只產生一個檔案不同,這種模式產生兩個檔案,其中一個是相對較小、可以單獨使用的高品質有損壓縮檔,另外一個是與有損檔案一起使用實現無損資料恢複的“修正”檔案。對於一些使用者來說,這就意味著他們不必再考慮使用有損還是無損壓縮這樣一個問題。
特點:
1、壓縮率:對於普通的流行音樂,通常介於30%-70% 之間;對於古典音樂以及其它音域較寬的音樂,通常能得到更高的比例
2、編解碼:快速高效壓縮與解壓
3、錯誤處理:出錯時的健壯性
4、音質:同APE
5、採樣率:支援非常高的採樣率
6、位元速率:8bit、16bit、24bit、32bit整型以及32bit浮點表示的WAV格式音頻檔案
7、開源性:開放原始碼,按照類似於BSD許可證的方式發布
8、其他:硬體支援,支援流媒體,支援ID3v1、APEv2標籤
MPEG-4 ALS
MPEG-4 ALS(LPAC,Lossless Predictive Audio Compression),也叫作音頻無損編碼,是一種無損音頻資料壓縮方法。
它是 MPEG-4 音頻標準的擴充,這個擴充的定稿時間是 2005年 12月。
MPEG4 ALS 在運算上類似於 FLAC,簡單來說就是一個用 Golomb coding 或者 Bounded Gilbert Moore Coding 對餘數進行編碼的量化線性預測性編碼預測器,可能是由於缺少可用的編碼器與解碼器,到了 2006年,這種格式仍然沒有被福士所接受。
特點:
1、壓縮率:
2、編解碼:
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:
7、開源性:
8、其他:
AU
AUDIO檔案是SUN公司推出的一種數字音頻格式。AU檔案原先是UNIX作業系統下的數字音效檔。由於早期INTERNET上的WEB伺服器主要是基於UNIX的,所以,AU格式的檔案在如今的Internet中也是常用的音效檔格式。
特點:
1、壓縮率:
2、編解碼:
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:
7、開源性:
8、其他:
ALAC
ALAC (Apple Lossless Audio Codec)為蘋果的無損音頻壓縮編碼格式。也因為是無損壓縮,聽起來與原檔案完全一樣,不會因解壓縮和壓縮而改變。 ALAC與MP3的主要分別在於編碼過程中,MP3會取消小部分高頻及低頻部分的音頻資料,而ALAC則會如實記錄,不會刪除音頻中任何細節資料。
它在2004年4月28日公布的iTunes4.5和QuickTime6.5.1的其中一部份。
特點:
1、壓縮率:壓縮至原先容量的40%-60%,高於MP3
2、編解碼:編碼、解碼速度很快
3、錯誤處理:
4、音質:同APE
5、採樣率:
6、位元速率:非壓縮音頻格式(WAV、AIFF)
7、開源性:ALAC的編碼器已於2011年10月26日以Apache License為協議公布原始碼
8、其他:目前攜帶型數字多媒體播放器中只有iPod可播放
有損壓縮————————————————————————————–
MPEG
MPEG是動態圖象專家組的英文縮寫。這個專家組始建於1988年,專門負責為CD建立視頻和音頻壓縮標準。MPEG音頻檔案指的是MPEG標準中的聲音部分即MPEG音頻層。目前Internet上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優勢是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4
MP3
MP3(MPEG3)格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮品質和編碼處理的不同分為3層,分別對應“.mp1”、“.mp2”、“.mp3”這3種音效檔。MPEG音頻檔案的壓縮是一種有損壓縮,同時基本保持低音頻部分不失真,但是犧牲了音效檔中12KHz到16KHz高音頻這部分的品質來換取檔案的尺寸。由於其檔案尺寸小,音質好;所以在它問世之初還沒有什麼別的音頻格式可以與之匹敵,因而為.mp3格式的發展提供了良好的條件。
特點:
1、壓縮率:壓縮至原先容量的8.5%-10%
2、編解碼:編碼、解碼速度很快
3、錯誤處理:
4、音質:採樣率越高音質越好
5、採樣率:最高48kHz
6、位元速率:可變編碼演算法下將會是區間值
7、開源性:LAME完美地實現了VBR(可變編碼率)演算法,而且它是是完全免費的軟體,並且由愛好者組成的Team Dev一直在不斷的發展完善。在VBR的基礎上,LAME更加發展出ABR演算法。ABR(AverageBitrate)平均位元速率,是VBR的一種插值參數。
8、其他:支援ID3標籤,支援流媒體,
RA
RA(RealAudio)有很多版本,RealAudio 1, RealAudio 2, RealAudio 3 最近已經到了RealAudio 11了,這些格式不同,依賴的媒體播放器也不同,同一播放器有些rm檔案能播放出來,有些又不能,這個時候可以看一下是不是RealAudio編碼的版本問題。
RealAudio主要適用於在網路上的線上音樂欣賞。現在大多數的使用者仍然在使用或更低速率的Modem,所以典型的回放並非最好的音質。有的下載網站會提示你根據你的Modem速率選擇最佳的Real檔案。real的的檔案格式主要有這麼幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網路頻寬的不同而改變聲音的品質,在保證大多數人聽到流暢聲音的前提下,令頻寬較富裕的聽眾獲得較好的音質。
1、壓縮率:
2、編解碼:
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:
7、開源性:
8、其他:
OGG
OGG(Ogg Vorbis)是一種新的音頻壓縮格式,類似於MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。OggVorbis檔案的副檔名是*.OGG。這種檔案的設計格式是非常先進的。這種檔案格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。Vorbis採用有損壓縮,但通過使用更加先進的聲學模型去減少損失。
目前最新的版本是2010年3月26日發布的libogg 1.2.0。[2]另一個版本libogg2也可以在Xiph.Org基金會的SVN包庫中找到。。
1、壓縮率:可以不斷改進
2、編解碼:可以不斷改進
3、錯誤處理:
4、音質:同樣位速率編碼的OGG與MP3相比聽起來更好一些
5、採樣率:
6、位元速率:
7、開源性:新BSD許可證下發布的自由軟體
8、其他:
VQF
雅馬哈公司開發,它的核心是減少資料流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從.wav檔案轉換到*.vqf檔案的軟體。此檔案缺少特點外加缺乏宣傳。
經SoundVQ壓縮後的音頻檔案在進行回放效果試聽時,幾乎沒有人能聽出它與原音頻檔案的差異。播放VQF對電腦的配置要求僅為奔騰75或更高,當然如果您用奔騰100或以上的機器,VQF能夠運行得更加出色。實際上,播放VQF對CPU的要求僅比Mp3高5~10%左右。VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的應用軟體都是免費的。
1、壓縮率:5%左右,壓縮比大於MP3和RA
2、編解碼:
3、錯誤處理:
4、音質:接近CD音質(16位44.1kHz立體聲)
5、採樣率:
6、位元速率:
7、開源性:NTT和YAMAHA並沒有公布VQF的原始碼
8、其他:
WMA
WMA (Windows Media Audio) 微軟開發,它和日本YAMAHA公司開發的VQF格式一樣,是以減少資料流量但保持音質的方法來達到比MP3壓縮率更高的目的。一些使用Windows Media Audio編碼格式編碼其所有內容的純音頻ASF檔案也使用WMA作為副檔名。
微軟公司在WMA 9大幅改進了其引擎,實際上64Kbps的WMA音樂就可以達到與128Kbps的MP3音樂接近的音質,比MP3體積少1/3左右。
WMA的另一個優點是內容供應商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內建了著作權保護技術可以限制播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是一個福音。
特點:
1、壓縮率:5%左右(只在MP3低於192KBPS碼率的情況下有效)
2、編解碼:
3、錯誤處理:
4、音質:音質要強於MP3格式,更遠勝於RA格式
5、採樣率:
6、位元速率:
7、開源性:
8、其他:DRM著作權保護,支援流媒體,ID3標籤,WMA9版本開始支援無損壓縮(Windows Media Audio 9 Lossless)
ATRAC
ATRAC (Adaptive Transform Acoustic Coding),自適應聽覺轉換編碼為Sony公司於1992年所開發的音訊有損資料壓縮技術,也是相關技術名詞之總稱。除了Sony本身,其他MiniDisc製造商如Sharp、Panasonic等,也有各自研發自家的ATRAC轉碼器。
Sony研發ATRAC初版(為避免混淆,稱作ATRAC1)後,又接續開發了相關的有損壓縮技術ATRAC2、ATRAC3、ATRAC3plus、以及無損的ATRAC Advanced Lossless。事實上,這五種壓縮技術除了名稱類似外,彼此之間並不盡相同。另外,ATRAC2、ATRAC3名稱末尾的數字,經常會被誤解為ATRAC的版本號碼,事實上該數字是編碼技術名稱的一部分。
ATRAC1,通常記作ATRAC。為減輕運算處理負擔,ATRAC1編碼時先使用兩次QMF (Quadrature Mirror Filters),將輸入的音訊分割為三個子頻帶;第一次分離出高頻(11.025~22.05kHz),第二次分離剩餘的中低頻(0~5.5125kHz、5.5125~11.025kHz)。子頻帶再於MDCT(Modified Discrete Cosine Transform,變址離散餘弦變換)切割分塊,並依據人耳對音訊敏感度而調整資料塊的分配量,也是所謂的自適應。壓縮時,ATRAC根據聽覺心理學,忽略人耳聽覺極限之外的音訊,以及被大音量屏蔽的細小聲音,以達到資料壓縮的目的。ATRAC1沒有明定如何流量分配等細節,便於日後微調改善音質。
1、壓縮率:
2、編解碼:
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:
7、開源性:
8、其他:
AAL
AAL(ATRAC Advanced Lossless)在2005年9月的A&VFesta2005中發表,是ATRAC家族中唯一的無失真壓縮規格,簡稱AAL。該格式可同時包含無失真壓縮、破壞性壓縮兩部份。破壞壓縮部份可使用ATRAC3、ATRAC3plus等格式,而無失真部份則是將原始音訊進行可逆性的無損壓縮。除了傳送整個AAL檔案至隨身聽外,也可以只取出較小的ATRAC3/ATRAC3plus部分。 AAL壓縮率約為30~80%,由於AAL同時內含有破壞性壓縮的音訊,因此破壞壓縮所使用的格式也會影響AAL的壓縮量。 AAL首度於2005年11月1日發表的SonicStage 3.3版所支援。可以傳送完整AAL資料給完全支援AAL的音樂播放器,也可以只傳送ATRAC3/ATRAC3plus的部份。硬體方面,SONY至2006年10月發表之NW-S700F、NW-S600才完全支援AAL。
1、壓縮率:
2、編解碼:
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:
7、開源性:
8、其他:
Musepack
Musepack(早前稱作MPEGplus、MPEG+或MP+)是一種基於MP2演算法的有損壓縮音頻格式。它的編碼方式著重聽覺上的穿透感,在160kbit/s或以上的表現尤為出色。 Musepack最初由Andree Buschmann提出和開發,其後經Frank Klemm接手,如今在Frank Klemm的協助下由MusepackTeam Dev(Musepack Development Team,MDT)維護。
特點:
1、壓縮率:
2、編解碼:比起MP3、AAC更為高效的哈夫曼編碼
3、錯誤處理:
4、音質:
5、採樣率:
6、位元速率:3kbit/s到1300kbit/s的純變碼率編碼
7、開源性:在微軟視窗、Linux和Mac OS X等平台上,在Musepack的官方網站上,除了有Musepack的編碼器和解碼器,還有為數款媒體播放器專用的第三方外掛程式,均以LGPL或BSD許可證發布
8、其他:噪音替換技術,APEv2標籤
AAC
AAC(Advanced Audio Coding),出現於1997年,基於MPEG-2的音頻編碼技術。由Fraunhofer IIS、杜比實驗室、AT&T、Sony等公司共同開發,目的是取代MP3格式。2000年,MPEG-4標準出現後,AAC重新整合了其特性,加入了SBR技術和PS技術,為了區別於傳統的MPEG-2 AAC又稱為MPEG-4 AAC。
不過直到2006年,使用這一格式儲存音樂的並不多,可以播放該格式的mp3播放器更是少之又少。此外電腦上很多音樂播放軟體都支援AAC(前提是安裝過AAC解碼器),如蘋果iTunes。但在行動電話領域,AAC的支援度已很普遍,Nokia、Sony Ericsson、Motorola等品牌均在其中高端產品中支援AAC(一開始主要是LC-AAC,隨著行動電話效能的發展,HE-AAC的支援也已廣泛)。
特點:
1、壓縮率:5%左右
2、編解碼:
3、錯誤處理:
4、音質:比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌
5、採樣率:最高96kHz
6、位元速率:8bit、16bit、24bit、32bit
7、開源性:
8、其他:
AMR
AMR全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於行動裝置的音頻(手機打電話),壓縮比比較大,但相對其他的壓縮格式品質比較差,由於多用於人聲,通話,效果還是很不錯的。
分類1. AMR: 又稱為AMR-NB,相對於下面的WB而言,語音頻寬範圍:300-3400Hz,8KHz抽樣
分類2. AMR-WB:AMR WideBand,語音頻寬範圍: 50-7000Hz 16KHz抽樣
AMR-WB採樣頻率為16kHz,是一種同時被國際標準組織ITU-T和3GPP採用的寬頻語音編碼通訊協定,也稱為G722.2標準。AMR-WB提供語音頻寬範圍達到50~7000Hz,使用者可主觀感受到話音比以前更加自然、舒適和易於分辨。與之作比較,現在GSM用的EFR(Enhenced Full Rate,增強型全速率編碼)採樣頻率為8kHz,語音頻寬為200~3400Hz。AMR-WB應用於窄帶GSM(全速通道16k,GMSK)的優勢在於其可採用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網路繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種應用中,AMR-WB抗擾度優於AMR-NB。AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從 6.6kb/s到23.85kb/s共九種編碼,語音品質超越PSTN固定電話。

AMR是專利產品

到這裡基本的音頻格式就已經介紹完了。我一直認為MIDI不能作為一種音頻格式來分類,因此我單獨給他一個分類
MIDI
MIDI(Musical Instrument Digital Interface)格式被經常玩音樂的人使用,MIDI允許數字合成器和其他裝置交換資料。MID檔案格式由MIDI繼承而來。MID檔案並不是一段錄製好的聲音,而是記錄聲音的資訊,然後在告訴音效卡如何再現音樂的一組指令。這樣一個MIDI檔案每存1分鐘的音樂只用大約5~10KB。MID檔案主要用於原始樂器作品,流行歌曲的業餘表演,遊戲音軌以及電子賀卡等。.mid檔案重放的效果完全依賴音效卡的檔次。.mid格式的最大用處是在電腦作曲領域。.mid檔案可以用作曲軟體寫出,也可以通過音效卡的MIDI口把外接音序器演奏的樂曲輸入電腦裡,製成.mid檔案。

iOS音頻技術的研究-音頻格式

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.