一张图看懂FLV文件格式

1. 简称

FLV 是 Flash Video 的简称,由 Adobe 公司制定。
存储文件,扩展名为 .flv
详细定义见《Adobe Flash Video File Format Specification Version 10.1》

2. 文件结构

FLV结构图

(图)FLV结构图
FLVHeader + PreTagSize + Tag + PreTagSize + Tag + …

2.1. FLV Header(9字节)

1-3:文件格式标识,必须为 46 4C 56【Signature】
4-4:版本,必须为 01【Version】
5-5:媒体标识位;
        1-5bit,必须为 0;【TypeFlagsReserved】
        6-6bit,音频标识;【TypeFlagsAudio】
        7-7bit,必须为 0;【TypeFlagsReserved】
        8-8bit,视频标识;【TypeFlagsVideo】
6-9:FLV头长度,必须为 00 00 00 09【DataOffset】

2.2. FLV Data (4+n字节)

1-4:前一个 tag 的长度【PreviousTagSize】
x-x:FLV Tag【Tag】

2.2.1. FLV Tag(11+n字节)

1-1:数据类型
        1-2bit,必须为 0;【Reserved】
        3-3bit,0 = 未加密,1 = 加密;【Filter】
        4-8bit,8 = 音频,9 = 视频,18 = 脚本数据;【TagType】
2-4:消息长度,从 StreamID 到 Tag 结尾,也等于 TagLen -11【DataSize】
5-7:时间戳,相对于第一个 Tag 时间戳,单位毫秒【Timestamp】
8-8:扩展时间戳,高位,单位毫秒【TimestampExtended】
9-11:流ID【StreamID】
xx-xx:Data

2.2.1.1. Tag Data : Audio Data

1-1:音频头【AudioTagHeader】
        1-4bit,音频格式【SoundFormat】
                0 = Linear PCM, platform endian
                1 = ADPCM
                2 = MP3
                3 = Linear PCM, little endian
                4 = Nellymoser 16 kHz mono
                5 = Nellymoser 8 kHz mono
                6 = Nellymoser
                7 = G.711 A-law logarithmic PCM , reserved
                8 = G.711 mu-law logarithmic PCM , reserved
                9 = reserved
                10 = AAC (supported in Flash Player 9,0,115,0 and higher)
                11 = Speex (supported in Flash Player 10 and higher)
                14 = MP3 8 kHz , reserved
                15 = Device-specific sound , reserved
        5-6bit,采样率【SoundRate】
                0 = 5.5kHz
                1 = 11kHz
                2 = 22kHz
                3 = 44kHz
        7-7bit,位宽,0 = 8bit samples, 1= 16bit samples【SoundSize】
        8-8bit,通道,0 = Mono, 1 = Stereo【SoundType】
[2-2]:AAC音频类型,注,只有在 SoundFormat=AAC 时,才有此数据
        0 = AAC sequence header
        1 = AAC raw
x-x:音频数据

注:SoundFormat
如果 SoundFormat=10 即AAC格式,官方建议使用44.1kHz采样率和双声道,即SoundType=1,SoundRate=3;Flash Player会忽略这两个参数,并从音频比特流中解析获得。
如果 SoundFormat=11 即Speex格式,音频使用压缩的16kHz采样率的单声道,各参数取值为SoundRate=0,SoundSize=1,SoundType=0。

2.2.1.2. Tag Data : Video Data

1-1:视频头【VideoTagHeader】
        1-4bit,帧类型【FrameType】
                1 = key frame (for AVC, a seekable frame)
                2 = inter frame (for AVC, a non-seekable frame)
                3 = disposable inter frame (H.263 only)
                4 = generated key frame (reserved for server use only)
                5 = video info/command frame
        5-8bit,编码类型【CodecID】
                2 = Sorenson H.263
                3 = Screen video
                4 = On2 VP6
                5 = On2 VP6 with alpha channel
                6 = Screen video version 2
                7 = AVC(H.264)
[2-5]:H.264视频类型,注,只有在 CodecID=AVC 时,才有此数据
        AVCPacketType
       CompositionTime (ISO 14496-12, 8.15.3)
x-x:视频数据

2.2.1.3. Tag Data : Script Data

1-1:格式类型【Type】
        0 = Number【DOUBLE】
        1 = Boolean【UI8】
        2 = String【SCRIPTDATASTRING】
        3 = Object【SCRIPTDATAOBJECT】
        4 = MovieClip (reserved, not supported)
        5 = Null
        6 = Undefined
        7 = Reference【UI16】
        8 = ECMA array【SCRIPTDATAECMAARRAY】
        9 = Object end marker
        10 = Strict array【SCRIPTDATASTRICTARRAY】
        11 = Date【SCRIPTDATADATE】
        12 = Long string【SCRIPTDATALONGSTRING】
x-x:

2.3. 元数据(metadata)

来源 FLV onMetaData
audiocodecid
audiodatarate
audiodelay
audiosamplerate
audiosamplesize
canSeekToEnd
creationdate
duration
filesize
framerate
height
stereo
videocodecid
videodatarate
width

来源 FMLE FLV metadata
audiochannels
audiocodecid
audiodatarate
audiodevice
audioinputvolume
audiosamplerate
creationdate
duration (media files only)
fmleversion (Flash Media Live Encoder version) (media files only)
framerate
height
lastkeyframetimestamp (media files only)
lasttimestamp (media files only)
presetname
videocodecid
videodatarate
videodevice
videokeyframe_frequency
width

3. 参考

常见 metadata 工具:flvtool2、flvmdi
IEC 14496-12 (MPEG-4 Part 12)