H.264 RTPpayload 格式------ H.264 視頻 RTP 負載格式
H.264 RTPpayload 格式------
H.264 視頻 RTP 負載格式
1. 網絡抽象層單元類型 (NALU)
NALU 頭由一個字節組成, 它的語法如下:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI| Type |
+---------------+
F: 1 個比特(禁止位).
forbidden_zero_bit. 在 H.264 規范中規定了這一位必須為 0.
NRI: 2 個比特.
nal_ref_idc. 取 00 ~ 11, 似乎指示這個NALU 的重要性,如00 的NALU 解碼器可以丟棄它而不影響圖像的回放.不過一般情況下不太關心這個屬性.
Type: 5 個比特.
nal_unit_type. 這個 NALU 單元的類型.簡述如下:
0 沒有定義
1-23 NAL單元 單個NAL 單元包.
24 STAP-A 單一時間的組合包
25 STAP-B 單一時間的組合包
26 MTAP16 多個時間的組合包
27 MTAP24 多個時間的組合包
28 FU-A 分片的單元
29 FU-B 分片的單元
30-31 沒有定義
2. 打包模式
下面是 RFC 3550 中規定的 RTP 頭的結構(12字節).
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 34 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|V=2|P|X| CC |M| PT | sequencenumber |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| timestamp |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| synchronization source (SSRC) identifier |
+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+
| contributing source (CSRC)identifiers |
| .... |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
負載類型Payload type (PT): 7 bits
序列號Sequence number (SN): 16 bits
時間戳Timestamp: 32 bits
H.264 Payload 格式定義了三種不同的基本的負載(Payload)結構.接收端可能通過RTP Payload 的第一個字節來識別它們.這一個字節類似NALU 頭的格式,而這個頭結構的NAL 單元類型字段則指出了代表的是哪一種結構,
這個字節的結構如下,可以看出它和H.264 的NALU 頭結構是一樣的.
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI| Type |
+---------------+
字段Type: 這個RTP payload 中NAL 單元的類型.這個字段和H.264 中類型字段的區別是,當type的值為24 ~ 31 表示這是一個特別格式的NAL 單元,而H.264 中,只取1~23 是有效的值.
24 STAP-A 單一時間的組合包
25 STAP-B 單一時間的組合包
26 MTAP16 多個時間的組合包
27 MTAP24 多個時間的組合包
28 FU-A 分片的單元
29 FU-B 分片的單元
30-31 沒有定義
可能的結構類型分別有:
1. 單一 NAL 單元模式
即一個 RTP 包僅由一個完整的NALU 組成.這種情況下RTP NAL 頭類型字段和原始的H.264的NALU 頭類型字段是一樣的.
2. 組合封包模式
即可能是由多個 NAL 單元組成一個RTP 包.分別有4種組合方式:STAP-A, STAP-B, MTAP16, MTAP24.那么這里的類型值分別是 24, 25, 26以及27.
3. 分片封包模式
用于把一個 NALU 單元封裝成多個RTP 包.存在兩種類型 FU-A 和 FU-B. 類型值分別是28 和 29.
2.1 單一NAL 單元模式
對于NALU 的長度小于MTU 大小的包,一般采用單一NAL 單元模式.
對于一個原始的H.264 NALU 單元常由[Start Code] [NALU Header] [NALU Payload] 三部分組成, 其中Start Code 用于標示這是一個NALU 單元的開始,必須是"00 00 00 01" 或 "00 00 01", NALU 頭僅一個字節,其后都是NALU 單元內容.
打包時去除 "00 00 01" 或 "00 00 00 01" 的開始碼, 把其他數據封包的 RTP 包即可.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|F|NRI| type | |
+-+-+-+-+-+-+-+-+ |
| |
| Bytes 2..n of a Single NALunit |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
如有一個H.264 的NALU 是這樣的:
[00 00 00 01 67 42 A0 1E 23 56 0E 2F ... ]
這是一個序列參數集NAL 單元.[00 00 00 01] 是四個字節的開始碼,67 是NALU 頭,42 開始的數據是NALU 內容.封裝成RTP 包將如下:
[ RTP Header ] [ 67 42 A0 1E 23 56 0E 2F ]
即只要去掉4 個字節的開始碼就可以了.
2.2 組合封包模式
其次,當NALU 的長度特別小時,可以把幾個NALU 單元封在一個RTP 包中.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| RTPHeader |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|STAP-A NAL HDR| NALU 1Size | NALU 1HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| NALU 1 Data |
: :
+ +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| | NALU 2Size | NALU 2 HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| NALU 2 Data |
: :
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
2.3 Fragmentation Units (FUs).
而當NALU 的長度超過MTU 時,就必須對NALU 單元進行分片封包.也稱為Fragmentation Units (FUs).
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| FU indicator | FUheader | |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |
| |
| FU payload |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure 14. RTP payload format for FU-A
The FUindicator octet has the following format:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI| Type |
+---------------+
The FU headerhas the following format:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|S|E|R| Type |
+---------------+
3. SDP 參數
下面描述了如何在SDP 中表示一個H.264 流:
. "m=" 行中的媒體名必須是"video"
. "a=rtpmap" 行中的編碼名稱必須是"H264".
. "a=rtpmap" 行中的時鐘頻率必須是 90000.
. 其他參數都包括在"a=fmtp" 行中.
如:
m=video 49170 RTP/AVP98
a=rtpmap:98 H264/90000
a=fmtp:98 profile-level-id=42A01E;sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==
下面介紹一些常用的參數.
3.1packetization-mode:
表示支持的封包模式.
當packetization-mode 的值為 0 時或不存在時,必須使用單一NALU 單元模式.
當packetization-mode 的值為 1 時必須使用非交錯(non-interleaved)封包模式.
當packetization-mode 的值為 2 時必須使用交錯(interleaved)封包模式.
這個參數不可以取其他的值.
3.2sprop-parameter-sets:
這個參數可以用于傳輸H.264 的序列參數集和圖像參數NAL 單元.這個參數的值采用Base64 進行編碼.不同的參數集間用","號隔開.
3.3 profile-level-id:
這個參數用于指示H.264 流的profile 類型和級別.由Base16(十六進制)表示的3 個字節.第一個字節表示H.264 的Profile 類型,第
三個字節表示H.264 的Profile 級別:
3.4 max-mbps:
這個參數的值是一個整型,指出了每一秒最大的宏塊處理速度.