繁體中文系統環境支援BIG-5碼、EUC碼、萬國碼(UTF-8)和電信碼。它們在系統中設定的碼別(亦指語言別)名稱為:
| BIG-5碼 | :zh_TW.big5、zh_HK.hkbig5 |
| EUC碼 | :zh_TW.eucTW |
| 萬國碼(UTF-8) | :zh_TW.utf8、zh_HK.utf8 |
| 電信碼 | :zh_TW.ccdc |
BIG-5碼(zh_TW.big5) |
 |
BIG-5碼係由資策會所策劃制定,用以配合國人在自製的五大套裝軟體上應用,而稱
BIG-5碼,又稱資策碼。它是一個2-byte內碼系統,可定義14,758個字碼。其高、低位元組的範圍如下。
| 高位元組 | A1-FE (標準字為A1-F9,其他是特殊符號和使用者造字區) |
| 低位元組 | 40-7E,A1-FE |
Big5碼香港增補字符集(zh_HK.hkbig5) |
 |
提供系統層級的支援,以支援香港地區big5增補字符集(Hong Kong Supplementary
Character Set,HKSCS)。HKSCS集合香港特別行政區(Hong Kong Special
Administration Region,簡稱HKSAR)於1999年9月所訂定的4,702個字元,專用於香港地區,作為香港的電腦計算要求通用字元集。
這些系統層級的支援可讓使用者輸入、儲存、取得、顯示並列印HKSCS字元。本支援乃根基於Unicode
2.1所指定的字庫及ISO 10646-1:1993標準。hp-ux 11i 1.6版已利用新的環境碼別、iconv轉碼程式、字形提供HKSCS的支援,並更新至Xlib、CDE、輸入法和印表機機型檔案。
以下是香港增補字符集在Big5碼內的編碼分布概況:
使用者造字區一 (FA40 - FEFE): | 763個字符 |
使用者造字區二 (8E40 - A0FE): | 2,898個字符 |
使用者造字區三 (8140 - 8DFE): | 641個字符 |
廠商造字區 (C6A1 - C8FE): | 359個字符 |
廠商造字區 (F9D6 - F9FE): | 41個字符 |
香港增補字符集只佔用了使用者造字區三的部分碼位。為方便管理使用者造字區,現把使用者造字區三細分為兩部分,詳情見下表。香港增補字符集現時沒有佔用使用者造字區三的第一部分,而將來的擴展版本也不會佔用這一部分。使用者造字區三的第二部分供香港增補字符集擴展之用。
字區 (碼位數目) | 分區 (碼位數目) | 用途 |
使用者造字區三(UDA3) 8140
- 8DFE (2,041個碼位) | 8140 - 84FE (628個碼位) | 香港增補字符集及其將來的擴展版本不會佔用這一區。 |
8510 - 8DFE (1,413個碼位) | 預留給香港增補字符集。現時已有641個字符放在這一區。 |
EUC碼(zh_TW.eucTW) |
 |
EUC碼之全名為Extended Unix Code,它只是一個編碼架構;字集內容和排列順序乃遵循經濟部中央標準局所公布之繁體中文標準交換碼(CNS
11643-1992)的規定,故而亦稱EUC/CNS碼。它是一個2-4byte內碼系統。目前HP-UX
11i支援該碼訂定的第一到第四字面,共27,181個字碼和第十二字面使用者造字區。繁體中文字第一字面為2-byte,第二字面以後為4-byte。
其高、低位元組的範圍如下。
第二字面以後有前導位元組8E,和字面代碼─第二字面為A2,第三字面為A3,依此類推,第十二字面即為AC。因此其實際內碼格式為1-2-4
byte型式,如下:
1-byte 20-7E
2-byte A1-FE A1-FE
4-byte 8E A2-AC A1-FE A1-FE
萬國碼(zh_TW.utf8、zh_HK.utf8) |
 |
萬國碼(Unicode)是HP最新加入支援的繁體中文碼。它是ISO-IEC 10646一對一的對應,ISO-IEC
10646是由國際標準組織(ISO)及國際電工聯盟(IEC)於西元1993年所制定。而HP採用的是UTF-8
(UCS Transformation Format-8)轉換格式,作為Unicode在HP-UX上的編碼架構(有別於Microsoft
Windows NT® 或Windows ® 2000所採用的UCS2編碼架構),以用在HP-UX
8位元的環境。
這一版的 HP-UX支援 Unicode 2.0 版,所以可支援 ISO 646 (1991)國際標準及CNS
11643 (1992)繁體中文標準交換碼第一到第四字面的部分的字。注意,有些第三、四字面的字並未定義在Unicode
2.0版標準內,故不予支援。
電信碼(zh_TW.ccdc) |
 |
電信碼是HP繁體中文碼裡面歷史最悠久的。它由交通部數據通信所編訂,全名為數據通信中文電碼,簡稱電信碼。它是一個2-byte內碼系統,可定義17,672個字碼,分二個字面。第一字面為7,902個字加41個繁體中文注音符號和94個標準
ASCII字符。第二字面為8,489個字。其高、低位元組的範圍如下。
| 高位元組 | A1-FE |
| 低位元組 | 第一字面A1-FE,第二字面21-7E |