Ir al contenido España-Español
HP.com España principal Productos y Servicios Soporte y Drivers Soluciones Cómo Comprar
» Contactar con HP
Más opciones
HP.com España principal
Libro blanco sobre las características de internacionalización de HP-UX 11.0 - 11i > Capítulo 2 Codificación de caracteres

Conversión entre codificaciones

» 

Documentación técnica

Libro completo en PDF
» Comentarios
Aquí empieza el contenido

 » Tabla de contenido

 » Glosario

 » Índice

Asignaciones de caracteres corregidas en iconv (1) e iconv (3C) [parche para 11.0, 11i v1]

Esta revisión contiene soluciones a anomalías para las asignaciones de caracteres incorrectas. Las correcciones afectan a caracteres del chino simplificado, chino tradicional, japonés y coreano de HP-UX.

Las asignaciones de conversión de caracteres corregidas permiten una mejor interoperabilidad al enviar datos de caracteres convertidos a sistemas compatibles con Unicode o recibirlos de dichos sistemas.

Corrección para el chino simplificado

Un parche corrige una asignación de caracteres incorrecta que se produce al efectuar la conversión entre hp15CN y Unicode (UCS2)/UTF-8 para el chino simplificado.

Específicamente, el carácter de doble línea vertical del chino simplificado se asignaba incorrectamente al realizar la conversión entre hp15CN y UCS2/UTF-8. Dicho carácter se asignaba al carácter de paralelo, que es distinto.

En la Tabla 2-19, «Cambios de las tablas de iconv para el chino simplificado», se resume el cambio aplicado en las tablas de iconv:

Tabla 2-19 Cambios de las tablas de iconv para el chino simplificado

hp15CNUCS2 incorrectoUCS2 correctoNombre de carácter
0xA1CE 0x2225Paralelo
0xA1AC0x22250x2016Doble línea vertical
 

Las tablas de convertidores de iconv hp15CN=ucs2 y ucs2=hp15CN se ven afectadas. Ambas conversiones, UCS2 y UTF-8, comparten dichas tablas.

No se prevén problemas de compatibilidad. No obstante, si surge alguna inquietud sobre la compatibilidad en relación con los datos persistentes almacenados en Unicode (UCS2) o UTF-8 en un sistema HP-UX, se puede generar una secuencia de comandos de conversión sencilla para buscar todas las manifestaciones de un valor incorrecto en UCS2 o UTF-8 y convertirlo en un valor correcto, según la asignación de la Tabla 2-20, «Asignación entre caracteres Unicode antiguos y nuevos para el chino simplificado».

Tabla 2-20 Asignación entre caracteres Unicode antiguos y nuevos para el chino simplificado

UCS2 antiguoUCS2UTF-8 antiguoUTF-8Nombre de carácter
0x22250x20160xe288a50xe28096Doble línea vertical

 

Corrección para el chino tradicional

Un parche corrige varias asignaciones de caracteres incorrectas que se producen al efectuar la conversión entre Big-5/EUC y Unicode (UCS2)/UTF-8 para el chino tradicional.

En el caso de la conversión de la codificación big5 a UCS2/UTF-8 y viceversa, el carácter de espacio ideográfico estaba ausente en la asignación de la tabla de conversión de Unicode:

Tabla 2-21 Cambios de las tablas de iconv para big5/Unicode

big5UCS2 incorrectoUCS2 correctoNombre de carácter
0xA140  0x3000Espacio ideográfico
 

En la siguiente tabla, se resumen los cambios aplicados a las conversiones entre eucTW y UCS2.

Tabla 2-22 Cambios de las tablas de iconv para eucTW/Unicode

eucTWUCS2 incorrectoUCS2 correctoNombre de carácter
0xa1a60x30fb0x2022Viñeta
0xa1b70x20140x2013Guión corto
0xa1b90x20130x2014Raya
0xa1b60xfe310xff5cLínea vertical de ancho completo
0xa1b8 0xfe32 0xfe31Forma de presentación para guión corto vertical
0xa1ea 0x2032 0x2035 Prima invertida
0xa1eb0x2035 0x2032 Prima
0xa2b90x22640x2266Menor que arriba de igual
0xa2ba0x22650x2267Mayor que arriba de igual
0xa2c20xfe660xfe65Signo mayor que pequeño
0xa2c30xfe650xfe66Signo igual pequeño
0xa2de0xff5c0x2223Divide
0xa2e10xfe670xff0f Barra de ancho completo
0xa2e40xffe50x00a5Signo del yen
0xa2e60xffe00x00a2Signo del céntimo
0xa2e70xffe10x00a3Signo de la libra esterlina
 

Las conversiones de iconv entre eucTW y UCS2 o UTF-8 pueden verse afectadas.

Las conversiones de big-5 con UCS2/UTF-8 no se ven afectadas directamente puesto que sólo se ha agregado la entrada de una tabla que faltaba.

Las tablas de convertidores de iconv para eucTW=ucs2, ucs2=eucTW, big5=ucs2 y ucs2=big5 se ven afectadas. Ambas conversiones, UCS2 y UTF-8, comparten dichas tablas.

No se prevén problemas de compatibilidad. No obstante, si surge alguna inquietud sobre la compatibilidad en relación con los datos persistentes almacenados en Unicode (UCS2) o UTF-8 en un sistema HP-UX, se puede generar una secuencia de comandos de conversión sencilla para buscar todas las manifestaciones de un valor incorrecto en UCS2 o UTF-8 y convertirlo en un valor correcto, según las asignaciones de la Tabla 2-23, «Asignación entre caracteres Unicode antiguos y nuevos para el chino tradicional».

Tabla 2-23 Asignación entre caracteres Unicode antiguos y nuevos para el chino tradicional

UCS2 antiguoUCS2UTF-8 antiguoUTF-8Nombre de carácter
0x30fb0x20220xe383bb0xe280a2Viñeta
0x20140x20130xe280940xe28093Guión corto
0x20130x20140xe280930xe28094Raya
0xfe310xff5c0xefb8b10xefbd9cLínea vertical de ancho completo
0xfe32 0xfe310xefb8b20xefb8b1Forma de presentación para guión corto vertical
0x2032 0x2035 0xe280b20xe280b5Prima invertida
0x2035 0x2032 0xe280b50xe280b2Prima
0x22640x22660xe289a40xe289a6Menor que arriba de igual
0x22650x22670xe289a50xe289a7Mayor que arriba de igual
0xfe660xfe650xefb9a60xefb9a5Signo mayor que pequeño
0xfe650xfe660xefb9a50xefb9a6Signo igual pequeño
0xff5c0x22230xefbd9c0xe288a3Divide
0xfe670xff0f 0xefb9a70xefbc8fBarra de ancho completo
0xffe50x00a50xefbfa50xc2a5Signo del yen
0xffe00x00a20xefbfa00xc2a2Signo del céntimo
0xffe10x00a30xefbfa10xc2a3Signo de la libra esterlina

 

Corrección para el japonés

Un parche corrige cuatro asignaciones de caracteres japoneses incorrectas que se producen entre Shift-JIS/EUC y Unicode (UCS2)/UTF-8.

En la siguiente tabla, se resumen los cambios aplicados.

Tabla 2-24 Cambios de las tablas de iconv para el japonés

sjiseucJPUCS2 incorrectoUCS2 correctoNombre de carácter
0x81500xA1B10xFFE30x203ESobrerraya
0x815C0xA1BD0x20150x2014Raya
0x818F0xA1EF0xFFE50x00A5Signo del yen
N/A0x8FA2B70x02DC0xFF5ETilde de ancho completo
 

Las conversiones de iconv afectadas son las realizadas entre SJIS y UCS2 o UTF-8, así como las conversiones entre eucJP y UCS2 o UTF-8.

Las tablas de conversión de iconv para sjis=ucs2, ucs2=sjis, eucJP=ucs2 y ucs2=eucJP se ven afectadas. Ambas conversiones, UCS2 y UTF-8, comparten dichas tablas.

No se prevén problemas de compatibilidad. No obstante, si surge alguna inquietud sobre la compatibilidad en relación con los datos persistentes almacenados en Unicode (UCS2) o UTF-8 en un sistema HP-UX, se puede generar una secuencia de comandos de conversión sencilla para buscar todas las manifestaciones de un valor incorrecto en UCS2 o UTF-8 y convertirlo en un valor correcto, según las asignaciones de la Tabla 2-25, «Asignación entre caracteres Unicode antiguos y nuevos para el japonés».

Tabla 2-25 Asignación entre caracteres Unicode antiguos y nuevos para el japonés

UCS2 antiguoUCS2UTF-8 antiguoUTF-8Nombre de carácter
0xFFE30x203E0xefbfa30xe280beSobrerraya
0x20150x20140xe280950xe28094Raya
0xFFE50x00A50xefbfa50xc2a5Signo del yen
0x02DC0xFF5E0xcb9c0xefbd9eTilde de ancho completo

 

Corrección para el coreano

Un parche ofrece una solución para abordar la disconformidad de normas en el caso de las asignaciones de caracteres Unicode (UCS2)/UTF-8 del coreano.

Las tablas de convertidores de iconv para el coreano actualmente suministradas no se ciñen a las normas Unicode 2.1 e ISO 10646 (con enmiendas de 1997) ni tampoco a la norma nacional coreana KSC-5700. Todas las organizaciones de normalización conocidas consideran anticuadas las asignaciones actuales.

La mejora ofrece un conjunto de tablas de convertidores de iconv que se ciñen a las normas para la conversión entre eucKR y Unicode/UTF-8. Específicamente, la región obsoleta de 0x3d2e-0x4dff se ha vuelto a asignar a la región 0xac00-0xd7ff especificada en Unicode 2.1 para el alfabeto hangul.

Sin esta modificación, es imposible compartir datos con ningún otro sistema que se ciña a las normas Unicode 2.1/ISO 10646/KSC-5700.

Las conversiones de iconv afectadas son las conversiones entre eucKR y UCS2 o UTF-8.

Las tablas de conversión de iconv afectadas por esta modificación son eucKR=ucs2 y ucs2=eucKR. Ambas conversiones, UCS2 y UTF-8, comparten dichas tablas.

No se prevén problemas de compatibilidad. No obstante, si surge alguna inquietud sobre la compatibilidad en relación con los datos persistentes almacenados en Unicode (UCS2) o UTF-8 en un sistema HP-UX, se recomienda guardar y cambiar el nombre de la tabla de ucs2=eucKR previamente instalada antes de instalar esta solución. A continuación, los datos persistentes se pueden volver a convertir a eucKR mediante esa tabla antigua y, luego, volver a convertirlos a la representación Unicode/UTF-8 correcta.

Convertidores de iconv del Consejo de Proveedores Japonés [11i v1.6]

Se han presentado convertidores de iconv nuevos para permitir una mayor interoperabilidad de la distribución de datos en los entornos computacionales japoneses. Los siguientes elementos están relacionados con este cambio:

  • Actualmente, hay disponibles tablas de conversión de iconv para japonés nuevas que se ciñen a las recomendaciones del grupo de trabajo (TOG/JVC) CDE/Motif Technical de Open Group y el Consejo de Proveedores Japonés encaminadas a asegurar la interoperabilidad de ISO 10646/Unicode/JIS X0221 en los entornos computacionales japoneses.

    NOTA: JIS X0221 es la norma nacional japonesa equivalente a ISO-10646:1993 y Unicode 2.1.

    Estas tablas realizan conversiones entre los caracteres EUC y Shift-JIS (SJIS) de HP a los especificados por la interpretación estricta de la norma JIS X0201, así como por las asignaciones Unicode y UTF-8 de Microsoft. Las asignaciones de conversión de la norma JIS X0221 extendida ya se admiten en HP-UX. Estos nuevos convertidores precisan 0,6 MB de espacio adicional.

    En la Tabla 2-26, «Convertidores de iconv nuevos», se muestran ocho tablas de convertidores de iconv nuevas que se facilitan para admitir las asignaciones alternativas en las conversiones de ida y vuelta entre EUC y Shift-JIS (SJIS) a Unicode y UTF-8 o desde los mismos.

    Tabla 2-26 Convertidores de iconv nuevos

    Conversión

    Interpretación

    eucJP0201 <-> ucs2

    JIS X0201
    eucJPMS <-> ucs2Microsoft
    sjis0201 <-> ucs2JIS X0201

    sjisMS <-> ucs2

    Microsoft

     

    En la Tabla 2-27, «Variaciones de asignación entre las asignaciones SJIS y Unicode», se ilustran las variaciones de asignación entre las tablas de convertidores al convertir entre asignaciones de caracteres SJIS y diferentes interpretaciones de Unicode.

    NOTA: Las asignaciones de la norma JIS X0201 extendida (Unix) ya están disponibles en HP-UX (en esta tabla se hace referencia a ellas como SJIS).

    Tabla 2-27 Variaciones de asignación entre las asignaciones SJIS y Unicode

    SJIS:

    Asignación sjis0201 UCS2Asignación SJIS UCS2Asignación sjisMS UCS2

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0x8150

    0xFFE30x203E0xFFE3
    0x815F0x005C0xFF3C0xFF3C

    0x818F

    0xFFE50x00A50xFFE5
    0x815C

    0x2014

    0x2014

    0x2015

    0x8160

    0x301C

    0x301C

    0xFF5E

    0x8161

    0x2016

    0x2016

    0x2225

    0x817C

    0x2212

    0x2212

    0xFF0D

    0x8191

    0x00A2

    0x00A2

    0xFFE0

    0x8192

    0x00A3

    0x00A3

    0xFFE1

    0x81CA

    0x00AC

    0x00AC

    0xFFE2

     

    En la Tabla 2-28, «Variaciones de asignación entre las asignaciones EUC y Unicode» se ilustran las variaciones de asignación entre las tablas de convertidores al convertir entre asignaciones de caracteres EUC y diferentes interpretaciones de Unicode.

    NOTA: Las asignaciones de la norma JIS X0201 extendida (Unix) ya están disponibles en HP-UX (en esta tabla se hace referencia a ellas como eucJP).

    Tabla 2-28 Variaciones de asignación entre las asignaciones EUC y Unicode

    EUC:

    Asignación eucJP0201 UCS2Asignación eucJP UCS2Asignación eucJPMS UCS2

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0xA1B1

    0xFFE30x203E0xFFE3
    0xA1C00x005C0xFF3C0xFF3C

    0xA1EF

    0xFFE50x00A50xFFE5
    0xA1BD

    0x2014

    0x2014

    0x2015

    0xA1C1

    0x301C

    0x301C

    0xFF5E

    0xA1C2

    0x2016

    0x2016

    0x2225

    0xA1DD

    0x2212

    0x2212

    0xFF0D

    0xA1F1

    0x00A2

    0x00A2

    0xFFE0

    0xA1F2

    0x00A3

    0x00A3

    0xFFE1

    0xA2CC

    0x00AC

    0x00AC

    0xFFE2

    0x8FA2B7

    0x007E

    0xFF5E0xFF5E

    0x8FA2C3

    0x00A60x00A60xFFE4

     

  • El grupo de trabajo TOG/JVC ha formalizado tres asignaciones de convertidores posibles para varios caracteres. Dichas asignaciones son:

    1. JIS X0221 basada en una interpretación estricta de la norma JIS X0201

    2. JIS X0221 extendida que permite una mayor coexistencia en los entornos actuales basados en ASCII (por ejemplo, Unix)

    3. JIS X0221 basada en asignaciones de caracteres japoneses para Microsoft

Mejoras de iconv para el soporte del euro en el griego [11i v1.6]

Para obtener información detallada sobre las mejoras de iconv para el soporte del euro en el griego, consulte la sección «Soporte del euro en el griego [11i v1.6]».

Convertidores de iconv en un gran sistema (mainframe) para los caracteres japoneses [parche para 11.0, parche para 11i v1, 11i v2]

Los convertidores de iconv entre ShiftJIS/eucJP/UCS2 y NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF en grandes sistemas (mainframe) se introdujeron en HP-UX 11i v1.0. Esta revisión incluye varias soluciones para errores de asignación de los caracteres estándar de la norma JIS.

Esta revisión de las tablas de conversión de iconv de grandes sistemas (mainframes) incluye numerosas soluciones para errores de asignación de los caracteres estándar de la norma JIS en la parte básica de dichos juegos de códigos de gran sistema (mainframe). Los cambios detallados se describen en MFConvChanges.jips, MFConvChanges.keis y MFConvChanges.jef del directorio /usr/share/doc.

Asimismo, esta revisión de métodos de conversión de iconv en grandes sistemas (mainframes) incluye una solución para manejar una secuencia con mayúsculas (shift) incompleta al final de un búfer de entrada.

Repercusión en el cliente

Si el cliente ya ha utilizado la versión HP-UX 11i v1 de los convertidores iconv de gran sistema (mainframe) y, posteriormente, utiliza esta versión, los resultados diferirán debido a las correcciones realizadas en las asignaciones de los caracteres estándar de la norma JIS. Se recomienda guardar y cambiar el nombre de las tablas instaladas anteriormente antes de instalar esta revisión. Posteriormente, los datos persistentes se pueden volver a convertir mediante la tabla antigua para, luego, volver a convertirlos a la representación correcta mediante las tablas nuevas.

Si existe la posibilidad de que el último carácter del búfer de entrada sea un carácter válido O una secuencia con mayúsculas (shift) incompleta, iconv(3C) responde con EINVAL. Si dicho carácter es el último del archivo de entrada, iconv(3C) nunca responde con éxito sin agregar otros datos ficticios como NULL al carácter. Dicho carácter es 0x1a para jipsj, 0x3f para jipsec/jipsek y 0xa para keis7c/keis7k/keis8c/keis8k, que podría ser un carácter de control O una secuencia con mayúsculas (shift) incompleta.

Compatibilidad

No se prevén problemas de compatibilidad. No obstante, si surge alguna inquietud sobre la compatibilidad en relación con los datos persistentes almacenados en un sistema HP-UX, se recomienda guardar y cambiar el nombre de las tablas instaladas anteriormente antes de instalar esta revisión. Posteriormente, los datos persistentes se pueden volver a convertir mediante dicha tabla antigua para, luego, volver a convertirlos a la representación correcta mediante las tablas nuevas.

Rendimiento

No hay ningún problema de rendimiento.

Documentación

  • Guía del usuario del entorno de sistema en japonés (redactada en japonés)

  • La página de manual de iconv(3C)

Planes para el futuro

Los convertidores de iconv de grandes sistemas (mainframes) realizarán un seguimiento de los cambios futuros que se efectúen en el soporte de la norma Unicode en HP-UX.

Versión para imprimir
Declaración de privacidad El uso de este sitio implica la aceptación de sus términos de uso
© 2001-2003, 2005 Hewlett-Packard Development Company, L.P.