| España-Español |
|
|
|
![]() |
Libro blanco sobre las características de internacionalización de HP-UX 11.0 - 11i > Capítulo 2 Codificación
de caracteresSoporte de Unicode 2.1 [parche para 11.0, 11i v1] |
|
HP-UX ofrece soporte a nivel de sistema para el juego de caracteres Unicode 2.1/ISO 10646. El soporte de Unicode que aporta Hewlett-Packard ofrece la base para habilitar la interoperabilidad heterogénea de todos los locales. ISO 10646 es una norma del sector para la definición de una sola codificación que codifique de forma única todos los caracteres del mundo. Unicode 2.1 es la especificación complementaria de ISO 10646. El soporte de Unicode se ciñe a las normas X/Open (OpenGroup), POSIX e ISO C existentes y a otras normas basadas en UNIX pertinentes. HP-UX 11.0 ofrece soporte de Unicode/ISO 10646 mediante el uso de la representación UTF-8 (Formato de transformación universal de 8 bits) para el almacenamiento persistente. UTF-8 es la representación en formato de varios bytes y 8 bits reconocida en el sector para Unicode. Dicha representación permite la transmisión satisfactoria de datos a través de protocolos de red de 8 bits, así como el almacenamiento y la recuperación seguros en el marco de un sistema operativo orientado históricamente a los bytes como, por ejemplo, HP-UX. Para el procesamiento interno, HP-UX utiliza la forma canónica de cuatro octetos (32 bits) especificada en la norma ISO 10646. Este soporte posibilita la paridad con la implementación actual de wchar_t de HP-UX, que está basada en una representación de 32 bits. Se facilita soporte pleno a nivel de sistemas para todos los locales ofrecidos en la revisión. Para obtener más información sobre las características Unicode del entorno ASE, consulte el directorio /usr/share/doc/ASX-UTF8. En las siguientes tablas, se presenta un subconjunto selecto de archivos binarios de locales que se facilitan para el procesamiento de aplicaciones de 32 bits: Tabla 2-13 Locales utf8 básicos para el procesamiento de aplicaciones de 32 bits
Tabla 2-14 Locales utf8 de idiomas europeos para el procesamiento de aplicaciones de 32 bits
Tabla 2-15 Locales utf8 de idiomas asiáticos para el procesamiento de aplicaciones de 32 bits
Para habilitar el soporte de Unicode en las aplicaciones, defina la variable de entorno en un locale utf8 deseado. Los locales se instalan en función de los conjuntos de archivos del idioma actual que ya estén instalados en un sistema de destino. Por ejemplo, si el sistema utiliza el alemán de alfabetización internacional, se instala el locale Unicode para alemán (de_DE.utf8). También se suministran los archivos de código fuente de TODOS los locales admitidos (un total de 34) para aplicaciones de 64 o 32 bits. Para crear locales Unicode, utilice el comando localedef. Consulte la página de manual de localedef(1M). Los sistemas deben tener definidos los parámetros del kernel MAXDSIZ, MAXTSIZ y SHMMAX en al menos 100 MB para garantizar una asignación de espacio de intercambio suficiente para que se efectúe una compilación satisfactoria con localedef de estos locales. Esta revisión ofrece un soporte de Unicode ampliado para armonizar el repertorio de caracteres con los locales ISO 8859-15 que se facilitan para el soporte del euro. Dicho soporte garantiza la interoperabilidad plena con el soporte recién agregado para el juego de códigos ISO 8859-15. Se aportan mejoras específicas para posibilitar la visualización y la entrada del euro con Xlib y fuentes nuevas. El soporte de Unicode necesita una cantidad adicional de espacio en disco que está en función del idioma utilizado. En las siguientes tablas, se relacionan los requisitos de tamaño de los idiomas específicos. La oferta Unicode básica que se instala en todos los sistemas es de aproximadamente 10 MB. Tabla 2-16 Locales Unicode de idiomas europeos y archivos traducidos
Tabla 2-17 Locales Unicode de idiomas asiáticos y archivos traducidos
Las aplicaciones que utilizan soporte de Unicode deben presentar un rendimiento comparable al de otros juegos de códigos de varios bytes. Para las aplicaciones que experimenten una transición de un juego de códigos de un byte a Unicode, se observará cierta repercusión en el rendimiento en el caso de algunos tipos de operaciones basadas en caracteres. El formato UTF-8 se admite en el módulo (ldterm) de disciplina de línea del controlador Streams PTY. El usuario no interactúa directamente con el controlador Streams PTY, sino que éste se ejecuta por debajo de la ventana dtterm. El controlador Streams PTY es responsable de ofrecer un canal de comunicación UTF-8 mientras que dtterm es responsable de procesar el código UTF-8 y de presentar los caracteres en la pantalla. Para obtener detalles, consulte la secuencia de comandos de modelos eucset (1), ldterm (7) y lp (1). |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||