| 中国 |
|
|
|
![]() |
HP-UX 11.0 - 11i 国际化特性白皮书 > 第 2 章 编码字符编码之间的转换 |
|
本发行版包含对错误字符映射的缺陷修复。更正内容涉及 HP-UX 的简体中文、繁体中文、日语和朝鲜语字符。 从能识别 Unicode 的系统中收发已转换的字符数据时,经过更正的字符转换器映射可以提高互操作性。 修补软件更正了在简体中文的 hp15CN 和 Unicode (UCS2)/UTF-8 之间转换时发生的一个字符映射错误。 具体来说,在 hp15CN 和 UCS2/UTF-8 之间转换时,简体中文字符双竖线映射不正确。该字符映射为另外一个字符:平行线字符。 表 2-19 “简体中文的 iconv 表中的更改” 概括了 iconv 表的更改:
hp15CN=ucs2 和 ucs2=hp15CN iconv 转换器表受到影响。这些表由 UCS2 和 UTF-8 转换共享。 预计不会发生兼容性问题。但是,如果在 HP-UX 系统中以 Unicode (UCS2) 或 UTF-8 存储的永久性数据发生兼容性问题,则可以生成一个简单转换脚本,以搜索出现的每个不正确的 UCS2 或 UTF-8 值,并根据表 2-20 “简体中文新旧 Unicode 字符之间的映射” 中的映射将其转换为正确的值。
修补软件更正了在繁体中文的 Big-5/EUC 和 Unicode (UCS2)/UTF-8 之间转换时发生的几个字符映射错误。 在 big5 编码和 UCS2/UTF-8 之间转换时,Unicode 转换表映射中缺少双字节的空格字符:
下表概括了适用于 eucTW 和 UCS2 之间转换的更改。 表 2-22 eucTW/Unicode 的 iconv 表中的更改
eucTW 和 UCS2 或 UTF-8 之间的 iconv 转换可能受到影响。 使用 UCS2/UTF-8 进行的 Big-5 转换并不直接受到影响,因为只添加了一个缺少的表条目。 eucTW=ucs2、ucs2=eucTW、big5=ucs2 和 ucs2=big5 iconv 转换器表将受到影响。这些表由 UCS2 和 UTF-8 转换共享。 预计不会发生兼容性问题。但是,如果在 HP-UX 系统中以 Unicode (UCS2) 或 UTF-8 存储的永久性数据发生兼容性问题,则可以生成一个简单转换脚本,以搜索出现的每个不正确的 UCS2 或 UTF-8 值,并根据表 2-23 “繁体中文新旧 Unicode 字符之间的映射” 中的映射将其转换为正确的值。 表 2-23 繁体中文新旧 Unicode 字符之间的映射
修补软件更正了在 Shift-JIS/EUC 和 Unicode (UCS2)/UTF-8 之间转换时发生的四个日语字符映射错误。 下表概括了适用的更改。 表 2-24 日语的 iconv 表中的更改
受影响的 iconv 转换是 sjis 和 UCS2 或 UTF-8 之间的转换以及 eucJP 和 UCS2 或 UTF-8 之间的转换。 sjis=ucs2、ucs2=sjis、eucJP=ucs2 和 ucs2=eucJP iconv 转换表将受到影响。这些表由 UCS2 和 UTF-8 转换共享。 预计不会发生兼容性问题。但是,如果在 HP-UX 系统中以 Unicode (UCS2) 或 UTF-8 存储的永久性数据发生兼容性问题,则可以生成一个简单转换脚本,以搜索出现的每个不正确的 UCS2 或 UTF-8 值,并根据表 2-25 “日语新旧 Unicode 字符之间的映射” 中的映射将其转换为正确的值。 表 2-25 日语新旧 Unicode 字符之间的映射
修补软件为朝鲜语 Unicode (UCS2)/UTF-8 字符映射不符合地址标准的问题提供了缺陷修复方法。 当前提供的朝鲜语 iconv 转换器表除了不符合朝鲜语国家标准 KSC-5700,还不符合 Unicode 2.1 和 ISO 10646(包括 1997 修订版)标准。所有知名的标准组织都将当前的映射视为过时的映射。 增强功能为 eucKR 和 Unicode/UTF-8 之间的转换提供了一组符合标准的 iconv 转换器表。具体来说,过时的 0x3d2e-0x4dff 区域已重新映射到用于朝鲜语的 Unicode 2.1 中指定的 0xac00-0xd7ff 区域。 如果不进行该修改,则无法与符合标准(遵守 Unicode 2.1/ISO 10646/KSC-5700 标准)的任何其他系统共享数据。 受影响的 iconv 转换是 eucKR 和 UCS2 或 UTF-8 之间的任何转换。 该修改影响的 iconv 转换表是 eucKR=ucs2 和 ucs2=eucKR。这些表由 UCS2 和 UTF-8 转换共享。 预计不会发生兼容性问题。但是,如果在 HP-UX 系统中以 Unicode (UCS2) 或 UTF-8 存储的永久性数据发生兼容性问题,建议在安装该修复程序之前,先保存并重命名以前安装的 ucs2=eucKR 表。然后,可以使用该旧表将永久性数据转换回 eucKR,再重新转换为正确的 Unicode/UTF-8 表示形式。 已引入了新的 iconv 转换器,可在日语计算环境中实现更高的数据共享互操作性。下列各项与该更改有关:
有关支持希腊语欧元符号的 iconv 增强功能的详细信息,请参阅“支持希腊语欧元符号 [11i v1.6]”。 ShiftJIS/eucJP/UCS2 与 NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF 之间使用的大型机 iconv 转换器在 HP-UX 11i v1.0 推出。本发行版包含对 JIS 标准字符映射错误的多个修复方法。 本发行版的大型机 iconv 转换表包括对那些大型机编码集的基本部分中的 JIS 标准字符映射错误的大量修复方法。/usr/share/doc 目录下的 MFConvChanges.jips、MFConvChanges.keis 和 MFConvChanges.jef 中详细说明了这些更改。 此外,本发行版的大型机 iconv 转换方法包括一个用于处理输入缓冲区末尾不完整的 shift 序列的修复方法。 如果客户已经使用过 HP-UX 11i v1 版的大型机 iconv 转换器,然后使用此版本,则结果会有所不同,因为已经对 JIS 标准字符映射进行了修复。建议在安装本发行版之前保存并重命名以前安装的表。然后,可以使用旧表转换回永久性数据,再使用新表重新转换为正确的表示形式。 如果输入缓冲区中的最后一个字符可能是有效字符或不完整的 shift 序列,iconv(3C) 将返回 EINVAL。当该字符是输入文件的最后一个字符时,如果在该字符之后不追加其他伪数据(如 NULL),iconv(3C) 将不会成功返回。该字符对于 jipsj 是 0x1a,对于 jipsec/jipsek 是 0x3f,对于 keis7c/keis7k/keis8c/keis8k 是 0xa(表示可能是一个控制字符或不完整的 shift 序列)。 预计不会发生兼容性问题。但是,如果在 HP-UX 系统中存储的永久性数据发生兼容性问题,建议在安装本发行版之前,先保存并重命名以前安装的表。然后,可以使用旧表转换回永久性数据,再使用新表重新转换为正确的表示形式。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||