本來是應該先寫一個媒體檔案格式的簡單講解的,還沒來得及寫,以後再寫。今天就先根據ffmpeg的flv.c的flv_demux這個結構體來講解一下當前比較流行的媒體格式flv.
FLV 是FLASH VIDEO的簡稱,FLV流媒體格式是隨著Flash MX的推出發展而來的視頻格式。由於它形成的檔案極小、載入速度極快,使得網路觀看視頻檔案成為可能.當前主流的媒體網站像國內的優酷、國外youtube其標清格式的檔案均採用flv的格式。
FLV檔案結構解析
FLV是一個二進位檔案,其檔案格式如 ,由檔案頭(FLV header)和很多tag組成。tag又可以分成三類:audio,video,script,分別代表音頻流,視頻流,指令碼流(關鍵字或者檔案資訊之類)。
FLV Header
FLV的Header資訊一般比較簡單,包括檔案類型之類的全域資訊。如中解析:
檔案類型3bytes 總是FLV(0x46 0x4C 0x56),否則就不是在ffmpeg中在沒有指定檔案格式的情況下,也是通過這個欄位來探測檔案是否屬於FLV格式的。
版本1byte 一般是0x01,表示FLV version 1
流資訊1byte 倒數第一bit是1表示有視頻,倒數第三bit是1表示有音頻,其他都應該是0(有些軟體如flvtool2可能造成倒數第四bit是1,不過也沒發現有什麼不對)
header長度4bytes 整個檔案頭的長度,一般是9(3+1+1+4),當然頭部欄位也有可能包含其它資訊這個時間其長度就不是9了。
FLV Body
FLV body就是由很多tag組成的,一個tag包括下列資訊:
previoustagsize 4bytes 前一個tag的長度,第一個tag就是0
tag類型1byte 共分為三類:
* 8 -- 音頻tag
* 9 -- 視頻tag
* 18 -- 指令碼tag
資料區長度3bytes 時間戳記3bytes 單位毫秒同時還有1bytes的擴充時間戳記,放在最高位,大部分時間時間戳記為媒體的dts資訊,如果是指令碼tag就是0
streamsID 3bytes 總是0(不知道幹啥用)
資料區:根據不同的tag類型就有不同的資料區
指令碼tag :
指令碼tag一般是用文本方式表示,如flv的metadata資訊:
從中可以看出是通過文本的方式來標記的,其解析後其header資訊為:
從中可以看出其type為18。time stamp為0.data size為33638.
metadata tag data資訊解析後為:
其中有一些媒體資訊:
例如視頻的:高和寬它的codec id。幀率。音訊資訊例如:音訊sample rate,codec id,sample size及是否立體聲。還有整個檔案的大小等等。
音訊tag資訊:
音訊tag資訊如:
其中time stamp 為0是因為其為第一個音頻tag.
視頻tag
這是檔案中的第6個tag所以其time stamp不為0。因為其為視頻tag所以其type為9。
ffmpeg中的flv檔案格式解析的實現:
其中flv_read_header主要是從檔案中讀取一些頭資訊,同時作一些初始化化的工作
static int flv_read_header(AVFormatContext *s,AVFormatParameters *ap)
{
……
url_fskip(s->pb, 4); //將flv的頭去掉。
flags = get_byte(s->pb);//讀出flv的video和audio flag資訊。
……
if(flags & FLV_HEADER_FLAG_HASVIDEO){
if(!create_stream(s, 0)) //建立視頻流
return AVERROR(ENOMEM);
}
if(flags & FLV_HEADER_FLAG_HASAUDIO){
if(!create_stream(s, 1)) //建立音頻流
return AVERROR(ENOMEM);
}
offset = get_be32(s->pb); //擷取檔案頭長度
……
}
其它tag的讀取:
static int flv_read_packet(AVFormatContext *s, AVPacket *pkt)
{
……
for(;;url_fskip(s->pb, 4)){ /* pkt size is repeated at end. skip it */
pos = url_ftell(s->pb);
type = get_byte(s->pb); //擷取tag的類型,前面已經提到flv的tag大概有以下三種 :FLV_TAG_TYPE_AUDIO = 0x08,FLV_TAG_TYPE_VIDEO = 0x09,FLV_TAG_TYPE_META = 0x12,
size = get_be24(s->pb);//擷取tag的長度
dts = get_be24(s->pb);
dts |= get_byte(s->pb) << 24; //計算tag的timestamp也就是dts資訊
……
if (type == FLV_TAG_TYPE_AUDIO) { //判斷是否為audio tag
……
} else if (type == FLV_TAG_TYPE_VIDEO) {//判斷是否為video tag
……
if ((flags & 0xf0) == 0x50) /* video info / command frame */
goto skip;
} else {
if (type == FLV_TAG_TYPE_META && size > 13+1+4)//判斷是否為meta tag,如果是meta資訊則會將資訊存放在一個map表中。
……
}
著作權:博水。轉載請註明出處:http://www.cnblogs.com/qingquan/