CNS 14696-2002 Video coding for low bit rate communication《低位速率通信用视讯编码》.pdf
《CNS 14696-2002 Video coding for low bit rate communication《低位速率通信用视讯编码》.pdf》由会员分享,可在线阅读,更多相关《CNS 14696-2002 Video coding for low bit rate communication《低位速率通信用视讯编码》.pdf(181页珍藏版)》请在麦多课文档分享上搜索。
1、1 低位元速率通信用視訊編碼 印月 94 10 月 本標準非經本局同意得翻印 中華民國國家標準 CNS 總號 號 ICS 35.110 14696 X1238 經濟部標準檢驗局印 公布日期 修訂公布日期 91 12 月 5 日 月日(共 181 頁) Video coding for low bit rate communication 1. 適用範圍 本標準規定可被用以將視聽服務 (Audio-Visual Service)的移動圖像組件 (Moving Picture Component) 壓縮成為低位元速之碼化表示法。視訊源編碼演算法 (Video Source Coding Algor
2、ithm)之基本組態係以 CNS 14217非電話信號之傳輸 p 64 kbps 視聽服務用之視訊編解碼器為基礎。係針對改進的效能 (Performance)及增加的功能性,本標準包含十種可協商之編碼選項。 2. 相關標準 1 CNS_(ITU-R Recommendation BT.601-5 (1995) - Studio Encoding Parameters of Digital Television for Standard 4:3 and Wide-Screen 16:9 Aspect Ratios. 2 CNS 14698視聽服務之基本結構傳輸多工及同步低位元速多媒體通信之多工協
3、定 3 CNS 14150非電話信號之線傳輸使用可達 2Mbps 位通道建視聽終端機間通訊之系統 4 CNS_(ITU-T Recommendation H.245 (1998) - Control protocol for multimedia communication. 5 CNS 14217非電話信號之傳輸 p 64 kbps 視聽服務用之視訊編解碼器 6 CNS_(ITU-T Recommendation H.262 (1995)| ISO/IEC 13818-2:1995 - Informa-tion technology - Generic coding of moving pi
4、ctures and associated audio infor-mation: video. 7 CNS 14697低位元速多媒體通訊用終端設備 3. 概述 圖 1 為編解碼器之概方塊圖。 3.1 視訊輸入及輸出 為使單一的標準,能適用於使用 625 和 525 掃瞄線電視標準的區域中,以及此區域之間,源編碼器運作的標準化訊源格式係以共同中介格式 (Common Intermediate Format,簡稱 CIF)為基礎。它也可能允許使用外部的協商 (如,CNS_(ITU-T H.245),以能夠使用大範圍之選項的特定訊源格式。如,輸入及輸出電視信號的標準可以是混合的或組件的、比的或位的
5、,而執源編碼格式之任何必需的轉換並非屬於本標準之範圍。 3.2 位輸入及輸出 視訊編碼器提供一個自我包含的位位元,此位元可以和其他多設施信號 2 CNS 14696 , X 1238 (Multi-Facility Signal)組合 (例如,如 CNS 14698 所定義 );視訊解碼器執行反向處理。 3.3 取樣頻率 圖像以視訊掃瞄線速率的整數倍來取樣,該取樣鐘訊與數位網路的鐘訊為非同步的 (Asynchronous)。 圖 1 視訊編解碼器之概略方塊圖 視訊多工編碼器編碼控制 (b) 視訊解碼器外部控制 傳輸緩衝器碼化位元流 視訊信號 源解碼器 接收緩衝器源編碼器 (a) 視訊編碼器視訊
6、多工解碼器3.4 源編碼演算法 本標準採用圖像間的預測與剩餘信號之轉換編碼兩者的併合,其中,圖像間的預測用以利用時間冗餘,而剩餘信號之轉換編碼用以降低空間的冗餘。解碼器具有移動補償 (Motion Compensation)之能力,允許在編碼器中選項的併入此技術。相對於 CNS 14217 使用全像素精度及迴路濾波器 (Loopfilter),本標準使用半像素精度於移動補償。使用可變長度編碼其符號將被傳送。 除了本標準核心的編碼演算法之外,在某些限制下,亦能同時地或個別地使用十六種可協商之編碼選項。附加的輔助資訊,亦可能包含於供增強的顯示能力及供外部使用之位元流裡。當需要時,可提供針對結果的視
7、訊位元流之一種應用的正向錯誤校正方法 (Forward Error Correction Method)以供使用。可協商之編碼選項、正向之錯誤校正、及輔助資訊之使用將在後續的小節中予以說明。 3.4.1 連續出現的多點及視訊多工模式 於此選項模式中,最多能有四種分離的視訊 “子位元流 “可在相同的視訊通道裡傳送,此一特性被設計來用於連續出現的多點應用裡,或沒有分離的邏輯通道可資使用,但卻希望使用多重視訊位元流的其他情形 (參照附錄 3)。 3.4.2 未設限移動向量模式 (Unrestricted Motion Vector Mode) 於此選項模式中,允許移動向量能指向圖像之外面,邊緣像素
8、(Edge Pixel)被用來作為對 “非既存 “像素之預測。如果有橫跨圖像邊緣的移動,則使用此種模式會獲致一顯著的增益,尤其是對於較小的圖像格式 (參照附錄 4)。此 3 CNS 14696 , X 1238 外,因為此種模式還包括移動向量範圍的延伸,所以對於較大移動向量亦能使用。對於攝影機之移動及大的圖像格式等情況,此模式特別地有用。 3.4.3 基於語法之算數編碼模式 (Syntax-based Arithmetic Coding Mode) 於此選項模式中,使用算數編碼來取代可變長度編碼, SNR 及重建圖像將會相同,但是所產生的位元將大量較少 (參照附錄 5)。 3.4.4 先進的預
9、測模式 (Advanced Prediction Mode) 於此選項模式中,重疊區塊移動補償 (Overlapped Block Motion Compensa-tion,簡稱 OBMC)被用於 P 圖像之亮度 (Luminance)部分 (參照附錄 6)。使用四個 88 向量來取代一個 1616 向量,以供圖像中某些巨區塊 (Macroblock)使用。編碼器必須決定所要使用的向量型式,四個向量雖然使用較多的位元,但是提供較佳的預測。使用這種模式通常會得到相當可觀的改善。因為 OBMC 造成較少的人造物 (Artifact)區塊,故將獲得主觀的增益 (Subjective Gain)。 3
10、.4.5 PB 訊框模式 (PB-frames Mode) 一個 PB 訊框係由被編碼成一個單元的兩幅圖像所組成,此一名稱 PB 是來自於 CNS_(ITU-T H.262)裡圖像型式的名稱,其中含有 P 圖像和 B 圖像。因此,一個 PB 訊框由一幅 P 圖像和一幅 B 圖像所組成,其中, P 圖像係從先前已解碼的 P 圖像所預測,而 B 圖像則是從先前已解碼的 P 圖像和目前正被解碼的 P 圖像兩者所預測。因為 B 圖像的大部分可以從過去的圖像和未來的圖像雙向 (Bidirection)地加以預測,所以就選擇了 B 圖像這個名稱。利用這種編碼選項,圖像的速率可大量增加,但實質上卻不必增加其
11、位元速率 (參照附錄 7),然而,本標準亦提供一個改進的 PB 訊框模式 (參照附錄13)。原始的 PB 訊框模式於此被留存,只是為了與早於改進的 PB 訊框模式被採用之系統相容 (Compatibility)之目的而已。 3.4.6 正向的錯誤校正 規定正向的錯誤校正方法是為了當適當的時候需要使用視訊位元流的保護時之用。提供做為正向錯誤校正的這種方法,是與規定於 CNS 14217 裡的BCH 碼之方法相同 (參照附錄 8)。 3.4.7 先進的 INTRA 編碼模式 於此選項的模式裡, INTRA 區塊是於編碼之前從相鄰的 INTRA 區塊先被預測的 (參照附錄 9)。個別的可變長度碼 (
12、Variable Length Code,簡稱 VLC)表是針對 INTRA 區塊而定義的。這種技術適用於在 INTRA 圖像的 INTRA 巨區塊,並適用於在 INTER 圖像內的 INTRA 巨區塊。此一模式比本標準的核心語法之 INTRA 編碼,顯著地改善了壓縮效能。 3.4.8 解區塊濾波器模式 (Deblocking Filter Mode) 於此選項的模式裡,一濾波器適用於越過已解碼的 I 圖像和 P 圖像 88 區塊之邊緣邊界,以減少人造物區塊 (參照附錄 10)。此濾波器的目的是於已解碼的圖像中做為減輕區塊邊緣人造物的發生。濾波器會影響被用於隨後的圖像預測,且因而將位於移動預測
13、的迴路 (Motion Prediction Loop)內之圖像。 3.4.9 片結構模式 (Slice Structured Mode) 4 CNS 14696 , X 1238 於此選項的模式中,一個 “片 “層被用來替代位元流語法的區塊群 (Group of Block,簡稱 GOB)層 (參照附錄 11)。這種模式的目的是提供增強的抗錯強健度能力 (Error Resilience Capability),使得位元流能更加順應於被用於基本的封包運輸遞送,和最小化視訊延遲。片類似於 GOB,是處於圖像層與巨區塊層之間的語法的一層。然而,相對於 GOB 結構所需固定的分割和固定的傳送次序而
14、言,一個片層的使用允許圖像有彈性的分割。 3.4.10 輔助的增強資訊 附加的輔助資訊包含於位元流裡,以報知所增強的顯示能力,或提供外部使用的資訊 (參照附錄 12)。此一輔助資訊用以報知,可使用或不使用重置尺寸 (Resizing)之一幅全圖像或部分的圖像之凍結或凍結釋放請求,亦用來對供外部使用的視訊流內特定的圖像或序列圖像加標籤,而且還可被用來運送供視訊合成使用的色度鍵資訊 (Chroma Key Information)。即使解碼器不能夠提供增強的能力來使用此一輔助資訊,或者甚至不能夠適當地解譯它,此輔助資訊也可出現於位元流裡。除非提供請求能力的需求業已由外部方法所協商,否則解碼器可容許
15、簡單地丟棄該輔助資訊。 3.4.11 改進的 PB 訊框模式 相較於 PB 訊框模式選項,此一選項模式代表一個改進的模式 (參照附錄 7和 13)。這兩種模式的主要差別是:於此改進的 PB 訊框模式,每個 B 區塊或許是使用個別的移動向量作正向預測或使用零向量作反向預測。當縮小規模的 P 向量並不是 B 預測好的選擇時,此種模式顯著地改善了編碼效率。當先前的 P 訊框與 PB 訊框之間有一個景象切割 (Scene Cut)時,這種反向預測是特別地有用的。 3.4.12 參考圖像選擇模式 提供一選項的模式,藉由允許從異於最近傳送的參考圖像作時間預測,以改善透過易生錯誤的通道 (Error-Pro
16、ne Channel)的即時視訊通信之效能 (參照附錄 14)。此種模式能與回送該訊息至編碼器,以通知有關其位元流是否正確地被收到之反向通道 (Back Channel)狀態訊息一起被使用。於易生錯誤的通道環境裡,此模式允許編碼器對通道狀況最佳化其視訊編碼。 3.4.13 時間、 SNR 和空間的可縮放性 (Scalability)模式 於此選項的模式支援時間、 SNR、及空間的可縮放性 (參照附錄 15)。可縮放性意含一個位元流係由一基本層和一或多個結合的增強層所構成。基本層為一個可獨立解碼之位元流。增強層可與基本層一同被解碼,其藉由增加圖像的速率、增加圖像的品質、或者增加圖像的尺寸,以增加
17、感受品質(Perceived Quality) 。 SNR 可縮放性表示在沒有增加圖像的解析度(Resolution)下,以增強的資訊來增加圖像的品質。空間的可縮放性表示藉由增加圖像的水平解析度、垂直解析度、或兩者,以增強的資訊來增加圖像的品質。藉由使用 B 圖像,亦支援時間可縮放性,一幅 B 圖像是一個可縮放性的增強,包含可從參考層中的兩幅圖像雙向地預測的圖像,其中一幅圖像在時間上居於目前圖像之前,而另一幅則尾隨於其後。 B 圖像允許欲被使用的增強層資訊,藉由增加顯示的增強視訊順序之圖像速率,來增 5 CNS 14696 , X 1238 加感受品質。這種模式於具有變動頻寬能力且具錯誤校正方
18、案的異質網路(Heterogenous Network)可能是有用的。 3.4.14 參考圖像再取樣 (Resampling)模式 提供一種語法以支援選項模式。針對此模式,使用於視訊影像預測 (Video Image Prediction)的參考圖像,於其被用以形成目前輸入圖像的預測物之前,以再取樣操作處理 (參照附錄 16)。如此可對視訊編碼之適當的影像解析度做有效率的動態選擇,而且也能支援圖像扭曲 (Picture Warping)以做為整體移動的補償物 (Compensator)或特效的產生物使用。 3.4.15 減縮解析度更新模式 (Reduced-Resolution Update
19、Mode) 提供一選項模式,允許對一個具有較高解析度的參考圖像 (參照附錄 17)做減縮解析度之更新。當編碼一個高活動的景象時,被期待使用這種模式,當在景象較為靜態的區域中,維持較高解析度的表示 (Representation)時,允許編碼器增加圖像速率,使得景象的移動部分能被表示。 3.4.16 獨立的段解碼模式 (Independent Segment Decoding Mode) 提供一選項模式,允許建造不具任何穿越 GOB 或多重 GOB 之視訊圖像段或片邊界 (參照附錄 18)的資料相依度 (Data Dependency)的圖像。藉由防止誤差資料越過視訊圖像段區域的邊界傳播,此模式
20、具抗錯強健性 (Error Robustness)。 3.4.17 替代的 INTER VLC 模式 當在圖像中有明顯的顯著變化時,提供此一選項模式,以改善 INTER 圖像編碼的效率 (參照附錄 19)。此一效率的改善係由允許原為 INTRA 圖像而設計之 VLC 碼也被用為 INTER 圖像的係數而獲得。 3.4.18 修改的量化模式 (Modified Quantization Mode) 提供一選項模式,以改善編碼之位元速率控制能力、減少色度 (Chrominance)量化誤差、擴展可表示的離散餘弦轉換 (Discrete Cosine Transform,簡稱DCT)係數的範圍、以及
21、對係數值設定某些限制 (參照附錄 20)。藉由加寬能被規定之步階尺寸 (Step Size)改變的範圍,此模式修改位元流之差動量化(Differential Quantization)步階尺寸參數的語意。也能減縮用於色度資料之量化步階尺寸。將 DCT 係數等級的範圍加寬,以保證任何可能的係數值能被編碼成在步階尺寸所允許的準確度 (Accuracy)之內。於此模式裡,也設定某些限制在係數中以增加錯誤檢測效能和最小化解碼器之複雜度(Complexity)。 3.5 位元速率 傳送鐘訊 (Transmission Clock)係由外部提供,視訊之位元速率是可變的。於本標準中,並未規定對視訊位元速率的
22、限制,其限制將由終端機或網路規定。 3.6 緩衝 編碼器必須控制其輸出的位元流,以遵從定義於附錄 2 的假想參考解碼器(Hypothetical Reference Decoder,簡稱 HRD)之需求。視訊資料應在每一個有效的鐘訊週期提供。使用 MCBPC 填補 (Stuff)(參照表 7 和 8),或者,當使用正向錯誤校正時,也可使用正向錯誤校正填補訊框來保證此點 (參照附錄 8)。 6 CNS 14696 , X 1238 經由編碼任何單一的圖像所產生之位元數,不得超過經由參數 BPPmaxKb 所指定的最大數值,該參數係以 1024 位元為單位來測量。 BPPmaxKb 參數可容許的最
23、小值,係依業已協商給位元流使用的最大圖像尺寸而定 (參照表 1)。圖像尺寸係以此亮度 (Y)組件之圖像的寬度乘以高度來測量,以像素為測量單位。編碼器可使用一個比在表 1 所規定的還大的 BPPmaxKb 值,只要此一較大的值是最初由外部方法協商而得的,譬如: CNS_(ITU-T H.245)。 當使用時間、 SNR、及空間的可縮放性模式時 (附錄 15),於每個增強層裡,針對每幅圖像而傳送的位元數將不得超過在 BPPmaxKb 中所規定的最大數值。 表 1 不同源圖像格式之最小 BPPmaxKb 以像素為單位之 Y 圖像大小 最小的 BPPmaxKb 至多 25 344 (或 QCIF) 6
24、4 25 360 至 101 376 (或 CIF) 256 101 392 至 405 504 (或 4CIF) 512 405 520 及以上 1 024 3.7 傳送的對稱性 編解碼器可使用於雙向的或單向的視覺通信 (Visual Communication)。 3.8 錯誤處理 錯誤處理應由外部方法提供 (譬如, CNS 14698)。假如不是由外部方法提供 (譬如, CNS 14152非電話信號之傳輸 -視聽電傳服務中之 64 至 1920Kbps 通道之訊框結構 ),則可以使用如附錄 8 所述之選項的錯誤校正碼和分框。 一解碼器能發送命令,以便於 INTRA 模式下,用編碼參數,諸
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CNS146962002VIDEOCODINGFORLOWBITRATECOMMUNICATION 低位 速率 通信 视讯 编码 PDF

链接地址:http://www.mydoc123.com/p-634457.html