CNS 14649-2-2003 Information technology - Universal multiple-Octet coded character set (UCS) -Part 2 Supplementary planes《信息技术-广用多八位编码字符集(UCS)-第2部:辅助字面》.pdf
《CNS 14649-2-2003 Information technology - Universal multiple-Octet coded character set (UCS) -Part 2 Supplementary planes《信息技术-广用多八位编码字符集(UCS)-第2部:辅助字面》.pdf》由会员分享,可在线阅读,更多相关《CNS 14649-2-2003 Information technology - Universal multiple-Octet coded character set (UCS) -Part 2 Supplementary planes《信息技术-广用多八位编码字符集(UCS)-第2部:辅助字面》.pdf(389页珍藏版)》请在麦多课文档分享上搜索。
1、 1 印月 94 10 月 本標準非經本局同意得翻印 中華民 國國 家標準 CNS 總號 號 經濟部標準檢驗局印 公布日期 修訂公布日期 92 10 月 9 日 月 日 Information technology - Universal multiple-Octet coded character set (UCS) - Part 2 : Supplementary planes 1. 適用範圍:本標準規定廣用多八位元編碼字元集(UCS)。適用於全球各種語文的書 寫形式和附加符號的表示、傳輸、交換、處、儲存、輸入和表達。 2. 用語釋義 除引用本標準第 1 部第 2 節所定義之用語外,本標準
2、第 2 部另定義下用語: (1) 文字與符號用輔助多語文字面 (Supplementary Multilingual Plane for scripts and symbols,簡稱 SMP) : 00 群組的 01 字面。 (2) 輔助表意文字字面 (Supplementary Ideographic Plane,簡稱 SIP) : 00 群組的 02 字面。 (3) 輔助特殊用途字面 (Supplementary Special-purpose Plane,簡稱 SSP) :00 群組 的 0E 字面。 3. 概述:本標準第 1 部規定 UCS 的整體架構及基本多語文字面(BMP)。本標準
3、第 2 部規定輔助字面,如下所述: (1) UCS 的文字與符號用輔助多語文字面(SMP),規定一組文字用圖形字元,但 包括輔助表意文字字面(SIP)和基本多語文字面(BMP)已編碼的圖形字元。 (2) UCS 的輔助表意文字字面(SIP) , 規定一組使用於東亞地區的圖形字元 , 又稱為 中日韓(縮寫為 CJK)表意文字(東亞表意文字)。 (3) UCS 的輔助特殊用途字面(SSP),規定一組特殊用途的圖形字元。 (4) 上述字面的字元的名稱及其正準形式編碼(四個八位元或 32 位元)。 上述輔助字面的圖形字元與本標準第 1 部已編碼的圖形字元重複 , 並且本標準第 2 部所編碼的任何字元都
4、只賦予一個編碼位置。 備考:Unicode 標準 3.1 版所提供的字元集,其字元名稱和編碼表示與本標準完全 相同 。 另外該標準並提供有助於實作的字元性質 、 處演算法及定義等詳 細資訊。 4. 符合性:本標準第 2 部之符合性,如第 1 部第 4 節之規定。 5. 字元編碼 依據本標準第 1 部 6.2 節所規定的編碼字元集正準形式 , 所有編碼字元集的每個 字元都以四個八位元表示之,而每個八位元則以個十進制字表示之。 引 01 、 02 和 0E 字面時,可使用縮寫形式,頭的三個十進制字, 如五位 11100 對應正準形式 0001 1100,該字元位於 01 字面。 本標準第 1 部附
5、 3 所規定的 UCS 轉換格式(UTF-16)可用以表示本標準第 2 部各 資訊技術廣用多八位元編碼字元集(UCS) 第2部:輔助字面 ICS 35.040 14649-2 X5066-2 ( 共 389 頁 ) 2 CNS 14649-2, X 5066-2 字面的字元。 備考: 以 UCS-4縮寫形式五位數和 UTF-16 配對值所描述的 01、 02 和 0E字面的 邊界編碼位置,如下表所示。 字面 UCS-4 值 UTF-16 配對值 01 10000 1FFFF D800 DC00 D83F DFFF 02 20000 2FFFF D840 DC00 D87F DFFF 0E E0
6、000 EFFFF DB40 DC00 DB7F DFFF 本標準第 1 部附錄 4 所規定的 UCS轉換格式(UTF-8)亦可用以表示本標準第 2 部各 字面的字元。轉換時,應以字元的 UCS-4 編碼為對應來源,但不包含上半區值與 下半區值。 備考: 以 UCS-4縮寫形式五位數和 UTF-8序列值所描述的 01、02 和 0E字面的邊 界編碼位置,如下表所示。 字面 UCS-4 值 UTF-8 序列值 01 10000 1FFFF F0 90 80 80 F0 9F BF BF 02 20000 2FFFF F0 A0 80 80 F0 AF BF BF 0E E0000 EFFFF F
7、3 A0 80 80 F3 AF BF BF UCS-2不能用以存取輔助字面裡的任何字元。 編碼位置 1FFFE、 1FFFF、 2FFFE、 2FFFF、 EFFFE 和 EFFFF永久保留。 備考:某些內部處理需使用到保證不會被視為字元碼的數值,這六個編碼位置可適 用之。 6. 文字與符號用輔助多語文字面 00群組 01字面為文字與符號用輔助多語文字面(SMP)。SMP係用以編碼除 CJK 表 意文字之外的世界上其它文字的圖形字元,這些字元並未編入 BMP。 SMP 所編碼 或預定編碼的文字,大多不屬於現代人用於溝通的文字。 備考:已擬議的 SMP可細分為下列幾部分: (1) 字母文字;
8、(2) 象形文字、表意文字和音節文字; (3) 非 CJK表意文字的文字; (4) 新發明的文字; (5) 符號集。 文字與符號用第 2 多語文字面(SMP)的概觀如圖 1 所示。 3 CNS 14649-2, X 5066-2 圖 1 文字與符號用第 2 多語文字面(SMP)概觀 備考: 舊義大利字母區塊表示認同的中世紀義大利半島上小王國的文字,包括 Etruscan、 Oscan、 Umbrian、 Faliscan和南北 Picene等的字母。這些字母, 部分可以由左而右或是由右而左書寫。編碼表中的字樣(glyph)一律採由左 而右。 7. 輔助表意文字字面 7.1 字面結構 00群組
9、02字面為輔助表意文字字面(SIP) 。SIP係用以編碼未曾編入 BMP的 CJK 認同表意文字(認同的東亞表意文字)。SIP CJK 認同表意文字的認同和整理 程序詳見 7.2節。 SIP 也用以編碼相容的 CJK 表意文字。相容字元的定義,詳見本標準第 1 部第 2 節 (13)。 輔助表意文字字面的概觀如圖 2 所示。 圖 2 輔助表意文字字面概觀 列八位元 舊義大利字母 哥德字母 猶他字母 拜占庭音樂符號 西洋音樂符號 數學文數字符號 保留給未來標準化使用 備考:各列中的垂直邊界僅為近似位置。 列八位元 CJK認同表意文字擴充 B CJK相容表意文字擴充 A 保留給未來標準化使用 備考
10、:各列中的垂直邊界僅為近似位置。 4 CNS 14649-2, X 5066-2 7.2 CJK認同表意文字擴充 B 雖然本標準第 1 部提供了 CJK認同表意文字的 G、 T、 J、 K 和 V 來源資訊,但 第 2 部則只提供單一字樣而不提供來源資訊。這些字元的來源詳見附錄 3。 漢字 G(中國大陸)來源包括: G_KX 康熙字典和康熙字典補遺裡 BMP未收錄的表意文字 G_HZ 漢語大字典裡 BMP未收錄的表意文字 G_CY 辭源 G_CH 辭海 G_HC 漢語大辭典 G_BK 中國大百科全書 G_FZ 方正排版系統 G_4K 四庫全書 漢字 H(香港)來源為: H 香港輔助字元集 漢字
11、 T(中華民國)來源包括: T4 民國 81 版 CNS 11643 第 4 字面 T5 民國 81 版 CNS 11643 第 5 字面 T6 民國 81 版 CNS 11643 第 6 字面 T7 民國 81 版 CNS 11643 第 7 字面 TF CNS 11643 第 15字面戶役政用字 漢字 J(日本)來源包括: J3 JIS X 213:2000 第 3 水準 J4 JIS X 213:2000 第 4 水準 漢字 K(南韓)來源為: K PKS 5700-3:1998 漢字 V(越南)來源包括: V0 TCVN 5773:1993 V2 VHN 01:1998 V3 VHN
12、02:1998 備考:本標準尚未提供的來源參引,例如北韓(KP 來源)的 KPS 9566-97 和 KPS 10721-2000,留待將來補充。 CJK認同表意文字的名稱規定為“CJK UNIFIED IDEOGRAPH-nnnnn”,nnnnn 為該字元的十六進制五位數字編碼,例如 SIP裡第 1 個 CJK認同表意文字的名 稱為“CJK UNIFIED IDEOGRAPH-20000”。 由來源字元集標準整理出認同表意文字的程序,以及相關的字元排序與編碼規 則,詳見本標準第 1 部附錄 17。 備考:SIP不引用該附錄 17.1.6節所敘述的原始碼分離規則。 7.3 CJK相容表意文字擴
13、充 A 5 CNS 14649-2, X 5066-2 這些 CJK相容表意文字的來源,詳見附錄 3。 備考:本標準之所以包含相容字元,主要是為了能與既有的編碼字元集進行雙 向轉碼而不遺漏資訊。 漢字 H(香港)來源為: H 香港輔助字元集 漢字 T(中華民國)來源包括: T4 民國 81 版 CNS 11643 第 4 字面 T5 民國 81 版 CNS 11643 第 5 字面 T6 民國 81 版 CNS 11643 第 6 字面 T7 民國 81 版 CNS 11643 第 7 字面 TF CNS 11643 第 15字面戶役政用字 CJK 相容表意文字的名稱規定為“CJK COMPA
14、TIBILITY IDEOGRAPH- nnnnn”,nnnnn為該字元的十六進制五位數字編碼,例如 SIP裡第 1 個 CJK 相 容表意文字的名稱為“CJK COMPATIBILITY IDEOGRAPH-2F800”。 8. 輔助特殊用途字面 8.1 字面結構 00群組 0E字面為輔助特殊用途字面(SSP)。 SSP係用於特殊用途圖形字元。編碼位置 E0000 至 E0FFF保留給替換格式字元, 詳見本標準第 1 部的第 20節。 備考:這些字元之中部分不具備可列印的圖形符號,因此無法顯示,例如標籤字元。 輔助特殊用途字面的概觀如圖 3 所示。 備考:此範圍內未指定的編碼,在正常處理和顯
15、示時應予忽略。 圖 3 輔助特殊用途字面概觀 8.2 標籤區塊 規定於標籤區塊內的字元都不具備可列印的圖形符號。在編碼表中,這些字元 的指示方式為:以字母置於標籤圖符之上並圍以虛線方塊。本標準不規定這些 字元的功能。 備考:這些字元的可能用途詳見附錄 6。 9. 特殊字元 除了第 8 節所規定的替換格式字元之外,本標準第 2 部還規定下列不具備可列印圖 形符號的特殊字元,詳見本標準第 1 部的第 20節。 備考:各列中的垂直邊界僅為近似位置。 保留給未來標準化使用 列八位元 標 籤 6 CNS 14649-2, X 5066-2 編碼位置 名稱 1D159 音樂符號 NULL NOTEHEAD
16、 1D173 音樂符號 BEGIN BEAM 1D174 音樂符號 END BEAM 1D175 音樂符號 BEGIN TIE 1D176 音樂符號 END TIE 1D177 音樂符號 BEGIN SLUR 1D178 音樂符號 END SLUR 1D179 音樂符號 BEGIN PHRASE 1D17A 音樂符號 END PHRASE 備考:音樂特殊字元的用途詳見附錄 7。 10. 編碼表及字元名稱表列: 輔助字面的編碼表及字元名稱表列,詳見隨後各頁。 備考:CJK 認同表意文字擴充 B 係匯集多國漢字標準而成,表 15 至表 348 裡的 字元遇有非取自漢字 T 來源(即我國中文字碼標準
17、 CNS 11643)者,其字 形或與我國主管機關所規定之標準字形略有差異,使用者應以 CNS 11643 之字形為準。 7 CNS 14649-2, X 5066-2 表 1 103列:舊義大利字母 G = 00 P = 01 8 CNS 14649-2, X 5066-2 表 1 103列:舊義大利字母 00群組 0 1 字面 0 3 列 編碼 名 稱 10300 OLD ITALIC LETTER A 10301 OLD ITALIC LETTER BE 10302 OLD ITALIC LETTER KE 10303 OLD ITALIC LETTER DE 10304 OLD ITA
18、LIC LETTER E 10305 OLD ITALIC LETTER VE 10306 OLD ITALIC LETTER ZE 10307 OLD ITALIC LETTER HE 10308 OLD ITALIC LETTER THE 10309 OLD ITALIC LETTER I 1030A OLD ITALIC LETTER KA 1030B OLD ITALIC LETTER EL 1030C OLD ITALIC LETTER EM 1030D OLD ITALIC LETTER EN 1030E OLD ITALIC LETTER ESH 1030F OLD ITALIC
19、 LETTER O (Faliscan) 10310 OLD ITALIC LETTER PE 10311 OLD ITALIC LETTER SHE 10312 OLD ITALIC LETTER KU 10313 OLD ITALIC LETTER ER 10314 OLD ITALIC LETTER ES 10315 OLD ITALIC LETTER TE 10316 OLD ITALIC LETTER U 10317 OLD ITALIC LETTER EKS (Faliscan) 10318 OLD ITALIC LETTER PHE 10319 OLD ITALIC LETTER
20、 KHE 1031A OLD ITALIC LETTER EF 1031B OLD ITALIC LETTER ERS (Umbrian) 1031C OLD ITALIC LETTER CHE (Umbrian) 1031D OLD ITALIC LETTER II (Oscan) 1031E OLD ITALIC LETTER UU (Oscan) 1031F (本編碼位置不得使用) 10320 OLD ITALIC NUMERAL ONE 10321 OLD ITALIC NUMERAL FIVE 10322 OLD ITALIC NUMERAL TEN 10323 OLD ITALIC
21、 NUMERAL FIFTY 10324 (本編碼位置不得使用) 10325 (本編碼位置不得使用) 10326 (本編碼位置不得使用) 10327 (本編碼位置不得使用) 10328 (本編碼位置不得使用) 10329 (本編碼位置不得使用) 1032A (本編碼位置不得使用) 1032B (本編碼位置不得使用) 1032C (本編碼位置不得使用) 1032D (本編碼位置不得使用) 1032E (本編碼位置不得使用) 1032F (本編碼位置不得使用) 編碼 名 稱 9 CNS 14649-2, X 5066-2 表 2 103列:哥德字母 G = 00 P = 01 10 CNS 146
22、49-2, X 5066-2 表 2 103列:哥德字母 00群組 0 1 字面 0 3 列 編碼 名 稱 10330 GOTHIC LETTER AHSA 10331 GOTHIC LETTER BAIRKAN 10332 GOTHIC LETTER GIBA 10333 GOTHIC LETTER DAGS 10334 GOTHIC LETTER AIHVUS 10335 GOTHIC LETTER QAIRTHRS 10336 GOTHIC LETTER IUJA 10337 GOTHIC LETTER HAGL 10338 GOTHIC LETTER THIUTH 10339 GOTH
23、IC LETTER EIS 1033A GOTHIC LETTER KUSMA 1033B GOTHIC LETTER LAGUS 1033C GOTHIC LETTER MANNA 1033D GOTHIC LETTER NAUTHS 1033E GOTHIC LETTER JER 1033F GOTHIC LETTER URUS 10340 GOTHIC LETTER PAIRTHRA 10341 GOTHIC LETTER NINETY 10342 GOTHIC LETTER RAIDA 10343 GOTHIC LETTER SAUIL 10344 GOTHIC LETTER TEIW
24、S 10345 GOTHIC LETTER WINJA 10346 GOTHIC LETTER FAIHU 10347 GOTHIC LETTER IGGWS 10348 GOTHIC LETTER HWAIR 10349 GOTHIC LETTER OTHAL 1034A GOTHIC LETTER NINE HUNDRED 1034B (本編碼位置不得使用) 1034C (本編碼位置不得使用) 1034D (本編碼位置不得使用) 1034E (本編碼位置不得使用) 1034F (本編碼位置不得使用) 編碼 名 稱 11 CNS 14649-2, X 5066-2 表 3 104列:猶他字母
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CNS1464922003INFORMATIONTECHNOLOGYUNIVERSALMULTIPLEOCTETCODEDCHARACTERSETUCSPART2SUPPLEMENTARYPLANES

链接地址:http://www.mydoc123.com/p-634397.html