一、FLV格式构造
FLV文件由FLV Header和FLV Body构成。
FLV Header | FLV Body |
总体格式:
类型 | 字节数 | 描述 | |
FLV Header | 文件标志 | 3 | 固定 F(0x46) L(0x4C) V(0x56) |
FLV版本号 | 1 | 一般为0x01 | |
内容标示 | 1 | 第0位和第2位,分别标识video和audio存在的情况。比如0x05, 00000101,代表既有视频,也有音频 | |
FLV消息头长度 | 4 | 从File Header开始到File Body开始的字节数,版本1中总为9 | |
FLV Body | Previous Tag size0 (4字节) 表示前一个Tag的长度 | ||
Tag1 | Tag Header | Tyep(1字节)表示Tag类型,包括音频(0x08),视频(0x09)和script data(0x12),其他类型值被保留 | |
DataSize(3字节)表示该Tag Data部分的大小 | |||
Timestamp(3字节)表示该Tag的时间戳 | |||
Timestamp_ex(1字节)表示是时间戳的扩展字节,当24位数值不够时,该字节最高位将时间戳扩展为32位数值 | |||
StreamID(3字节)表示stream id总数0 | |||
Tag Data | 不同类型Tag的data部分结构各不相同,但header的结构是相同 | ||
Previous Tag size1 (4字节) 即Tag1的大小 | |||
Tag2 | |||
Previous Tag size2 (4字节) 即Tag2的大小 | |||
... ... | |||
Tagn | |||
Previous Tag sizen (4字节) 即Tagn的大小 |
二、FLV Header头部信息
头部分由以下几部分组成:
Signature(3 byte) + Version(1 byte) + Flags(1 byte) + DataOffset(4 byte)
字段名 | 字节数 | 描述 |
signature | 3 | 固定FLV三个字符作为表示,0x46 0x4C 0x56 |
Version | 1 | 表示FLV的版本号,一般都是1 |
Flags | 1 | 内容标识,第0位和第2位,分别标识video和audio存在的情况。比如0x05, 00000101,代表既有视频,也有音频 |
DataOffset | 4 | 表示FLV的header长度,这里可以看到固定是9 |
图示:
三、FLV BODY 文件内容部分
Body是由一个个Tag组成的,每个Tag下面有一块4个字节的空间,用于记录这个Tag的长度。这个后置的PreviousTagSize用于逆向读取处理,表示的是前面的Tag的大小。
FlV的组成由一系列的back-pointers + tag构成
- back-pointers 固定4个字节,表示前一个tag的size
- tag分三种类型,video、audio、scripts
tag组成:
字段名 | 字节数 | 描述 |
tag type | 1 | 8为Audio,9为Video,18为Scripts |
tag data size | 3 | 表示tag data的长度,从stream id后算起 |
Timestreamp | 3 | 时间戳 |
TimestampExtended | 1 | 时间戳扩展字段 |
streamId | 3 | 总是0 |
tagData | n | 数据部分 |
四、Script的TagData内容
1、脚本Tag一般只有一个,是flv的第一个Tag,用于存放flv的信息,比如duration、audiodatarate、creator、width等;
2、所有数据都是以 数据类型 + (数据长度) + 数据的格式出现的,数据类型占1byte,数据长度看数据类型是否存在。
比如如下图:
type = 0x02 对应String
size = 0x0A = 10 长度
value = 0x6F 0x6E....0x61 = onMetaData 正好是10个字节。
3、Tag Data结构包含两个AMF包。第一个AMF包装“onMetaData”标志,第二个AMF包封装一个数组类型,这个数组中包含了音视频信息项的名称和值。
上图为第二个AMF
type = 0x08 对应ECMA array type。类似Map, 后面4个字节为数组的个数(00000004,表示有4个键值对),然后是键值对,第一个2个字节的键名长度(0005,长度为5),接下来就是键名(0x7769647468 = "width")。
之后就是数据类型,然后根据类型来判断长度,键名过后是0x00,表示之后跟着8个字节的double类型,0x408600000000 = 704.000,这之间的相互转换可以自行百度“IEEE 754”
说明:
java中double通过IEEE754转long的方法
double b = 23.45;
long value = Double.doubleToRawLongBits(b);
五、Video的TagData内容
type=0x09
size=0x00001E=30。长度为30
timestreamp=0x000000
TimestampExtended = 0x00
streamId = 0x000000
之后的数据就是 :视频信息+数据
0x17 前四位是帧类型Frame Type,后四位为编码ID(CodeId)
FrameType = 1 ; CodeId = 7
帧类型
编码ID
当CodeID = 7 (AVC(H.264))的情况,VideoTagHeader会多出4个字节的信息,AVCPacketType和CompositionTime。
AVCPacketType占1个字节
值 | 类型 |
0 | AVCDecoderConfigurationRecord(AVC sequence header) |
1 | AVC NALU |
2 | AVC end of sequence (lower level NALU sequence ender is not required or supported) |
AVCDecoderConfigurationRecord:包含着是H.264解码相关毕竟重要的SPS(序列参数集)和PPS(图像参数集)信息。在给AVC解码器推送数据流之前一定要把sps和pps信息送出,否则的话解码器不能正常解码。AVCDecoderConfigurationRecord在flv文件中一般出现一次,也就是第一个video Tag。
CompositionTime占3个字节
条件 | 值 |
AVCPacketType == 1 | Composition time offset |
AVCPacketType != 1 | 0 |
AVCDecoderConfigurationRecord格式:
0x01 + sps[1] + sps[2] + sps[3] + 0xFF + 0xE1 + sps size(2个字节) + sps + 01 + pps size(2个字节) + pps
如图所示:
sps[1] = 0x64
sps[2] = 0x00
sps[3] = 0x20
sps size = 0x0019 = 25
跳过25个字节后,是0x01
pps size = 0x0005
跳过5个字节,就到了back-pointers。
解析出sps和pps tag后,后面的video tag就是真正的视频数据内容。
六、Audio的TagData内容
与视频格式类似,前四位为音频格式,
接着2位为采样率
接着1位为采样的长度
七、FLV文件分析工具
工欲善其事必先利其器,所以有款强大的分析工具,对于提高效率是有多么重要,FlvAnalyzer就是一款强大的flv分析工具。图形界面如下,大家可以自行去网上下载。
本文暂时没有评论,来添加一个吧(●'◡'●)