Salta l'introduzione Italia - Italiano
HP.com Italia Prodotti e Servizi Supporto e Drivers Soluzioni Come Acquistare
» Contatta HP
Altre opzioni
HP.com Italia
Libro bianco sulle caratteristiche di internazionalizzazione di HP-UX 11.0 - 11i > Capitolo 2 Codifica dei caratteri

Conversione tra le codifiche

» 

Documentazione tecnica

Libro completo in PDF
» Feedback
Inizio contenuto

 » Sommario

 » Glossario

 » Indice

Mappature corrette dei caratteri ad iconv (1) ed iconv (3C) [patch per 11.0, 11i v1]

Questa release contiene la correzione degli errori nella mappatura dei caratteri. Queste correzioni riguardano i caratteri HP-UX per cinese semplificato, cinese tradizionale, giapponese, e coreano.

La correzione delle mappature dei caratteri nella conversione consente di migliorare l’interoperabilitą nell’invio o la ricezione di dati di caratteri convertiti da oppure a sistemi che utilizzano Unicode.

Correzioni per il cinese semplificato

Una patch corregge un’errata mappatura dei caratteri che si verifica nella conversione tra hp15CN ed Unicode (UCS2)/UTF-8 per il cinese semplificato.

In particolare, il carattere cinese semplificato Linea verticale doppia era assegnato erroneamente nella conversione tra hp15CN ed UCS2/UTF-8. Questo carattere era assegnato a quello Parallelo a, che č un carattere differente.

La Tabella 2-19, “Modifiche alle tabelle di iconv per il cinese semplificato” riepiloga le modifiche applicate alle tabelle di iconv:

Tabella 2-19 Modifiche alle tabelle di iconv per il cinese semplificato

hp15CNUCS2 erratoUCS2 correttoNome del carattere
0xA1CE 0x2225Parallelo a
0xA1AC0x22250x2016Linea verticale doppia
 

Sono interessate le tabelle di conversione hp15CN=ucs2 e ucs2=hp15CN di iconv. Queste tabelle sono condivise dalle conversioni UCS2 e UTF-8.

Non sono previsti problemi di compatibilitą. Tuttavia, se dovessero sorgere preoccupazioni di compatibilitą riguardanti dati persistenti archiviati in Unicode (UCS2) o UTF-8 in un sistema HP-UX, č possibile creare un semplice script di conversione per cercare un valore errato per ogni occorrenza in UCS2 o UTF-8 e convertirlo in quello corretto, in base alle mappature della Tabella 2-20, “Mappatura tra vecchi e nuovi caratteri Unicode per il cinese semplificato”.

Tabella 2-20 Mappatura tra vecchi e nuovi caratteri Unicode per il cinese semplificato

Vecchio UCS2UCS2Vecchio UTF-8UTF-8Nome carattere
0x22250x20160xe288a50xe28096Linea verticale doppia

 

Correzioni per il cinese tradizionale

Una patch corregge varie mappature errate dei caratteri che si verificano nella conversione tra Big-5/EUC ed Unicode (UCS2)/UTF-8 per il cinese tradizionale.

Nel caso di una codifica big5 a oppure da UCS2/UTF-8, il carattere Simbolo ideografico era assente nella mappatura della tabella di conversione Unicode:

Tabella 2-21 Modifiche alle tabelle di iconv per big5/Unicode

big5UCS2 erratoUCS2 correttoNome carattere
0xA140  0x3000Simbolo ideografico
 

La tabella seguente riepiloga le modifiche applicate per la conversione tra eucTW ed UCS2.

Tabella 2-22 Modifiche alle tabelle di iconv per eucTW/Unicode

eucTWUCS2 erratoUCS2 correttoNome del carattere
0xa1a60x30fb0x2022Punto elenco
0xa1b70x20140x2013Trattino breve
0xa1b90x20130x2014Trattini
0xa1b60xfe310xff5cLinea verticale spessore pieno
0xa1b8 0xfe32 0xfe31Forma di presentazione per trattino breve verticale
0xa1ea 0x2032 0x2035 Primo rovesciato
0xa1eb0x2035 0x2032 Primo
0xa2b90x22640x2266Minore o uguale a
0xa2ba0x22650x2267Maggiore o uguale a
0xa2c20xfe660xfe65Maggiore di, piccolo
0xa2c30xfe650xfe66Segno uguale, piccolo
0xa2de0xff5c0x2223Divide
0xa2e10xfe670xff0f Solido spessore pieno
0xa2e40xffe50x00a5Simbolo Yen
0xa2e60xffe00x00a2Simolo centesimo
0xa2e70xffe10x00a3Simbolo sterlina
 

La conversione con iconv tra eucTW ed UCS2 oppure UTF-8 potrebbe esserene interessata.

La conversione Big-5 con UCS2/UTF-8 non č interessata direttamente, dato che č stata aggiunta solamente una voce mancante della tabella.

Sono interessate le tabelle di conversione eucTW=ucs2, ucs2=eucTW, big5=ucs2 e ucs2=big5 di iconv. Queste tabelle sono condivise dalle conversioni UCS2 e UTF-8.

Non sono previsti problemi di compatibilitą. Tuttavia, se dovessero sorgere preoccupazioni di compatibilitą riguardanti dati persistenti archiviati in Unicode (UCS2) o UTF-8 in un sistema HP-UX, č possibile creare un semplice script di conversione per cercare un valore errato per ogni occorrenza in UCS2 o UTF-8 e convertirlo in quello corretto, in base alle mappature della Tabella 2-23, “Mappature tra vecchi e nuovi caratteri Unicode per il cinese tradizionale”.

Tabella 2-23 Mappature tra vecchi e nuovi caratteri Unicode per il cinese tradizionale

Vecchio UCS2UCS2Vecchio UTF-8UTF-8Nome carattere
0x30fb0x20220xe383bb0xe280a2Punto elenco
0x20140x20130xe280940xe28093Trattino breve
0x20130x20140xe280930xe28094Trattini
0xfe310xff5c0xefb8b10xefbd9cLinea verticale spessore pieno
0xfe32 0xfe310xefb8b20xefb8b1Forma di presentazione per trattino breve verticale
0x2032 0x2035 0xe280b20xe280b5Primo rovesciato
0x2035 0x2032 0xe280b50xe280b2Primo
0x22640x22660xe289a40xe289a6Minore o uguale a
0x22650x22670xe289a50xe289a7Maggiore o uguale a
0xfe660xfe650xefb9a60xefb9a5Maggiore di, piccolo
0xfe650xfe660xefb9a50xefb9a6Segno uguale, piccolo
0xff5c0x22230xefbd9c0xe288a3Divide
0xfe670xff0f 0xefb9a70xefbc8fSolido spessore pieno
0xffe50x00a50xefbfa50xc2a5Simbolo Yen
0xffe00x00a20xefbfa00xc2a2Simolo centesimo
0xffe10x00a30xefbfa10xc2a3Simbolo sterlina

 

Correzioni per il giapponese

Una patch corregge quattro mappature errate dei caratteri giapponesi che si verificano nella conversione tra Shift-JIS/EUC ed Unicode (UCS2)/UTF-8.

La tabella seguente riepiloga le modifiche applicate.

Tabella 2-24 Modifiche alle tabelle di iconv per il giapponese

sjiseucJPUCS2 erratoUCS2 correttoNome del carattere
0x81500xA1B10xFFE30x203ELinea alta
0x815C0xA1BD0x20150x2014Trattini
0x818F0xA1EF0xFFE50x00A5Simbolo Yen
N/D0x8FA2B70x02DC0xFF5ETilde spessore pieno
 

Le conversioni di iconv interessate sono quelle tra sjis ed UCS2 oppure UTF-8, oltre a quelle tra eucJP ed UCS2 oppure UTF-8.

Sono interessate le tabelle di conversione sjis=ucs2, ucs2=sjis, eucJP=ucs2 e ucs2=eucJP di iconv. Queste tabelle sono condivise dalle conversioni UCS2 e UTF-8.

Non sono previsti problemi di compatibilitą. Tuttavia, se dovessero sorgere preoccupazioni di compatibilitą riguardanti dati persistenti archiviati in Unicode (UCS2) o UTF-8 in un sistema HP-UX, č possibile creare un semplice script di conversione per cercare un valore errato per ogni occorrenza in UCS2 o UTF-8 e convertirlo in quello corretto, in base alle mappature della Tabella 2-25, “Mappature tra vecchi e nuovi caratteri Unicode per il giapponese”.

Tabella 2-25 Mappature tra vecchi e nuovi caratteri Unicode per il giapponese

Vecchio UCS2UCS2Vecchio UTF-8UTF-8Nome carattere
0xFFE30x203E0xefbfa30xe280beLinea alta
0x20150x20140xe280950xe28094Trattini
0xFFE50x00A50xefbfa50xc2a5Simbolo Yen
0x02DC0xFF5E0xcb9c0xefbd9eTilde spessore pieno

 

Correzioni per il coreano

Una patch offre la correzione di errori nell’indirizzare non conformitą agli standard per la mappatura dei caratteri Unicode (UCS2)/UTF-8 coreani.

Le tabelle di conversione di iconv per il coreano attualmente fornite non sono conformi agli standard Unicode 2.1 ed ISO 10646 (con le varianti del 1997) oltre agli standard nazionali coreani, KSC-5700. Le mappature correnti sono da considerarsi obsolete da tutte le organizzazioni per gli standard conosciute.

Le migliorie offrono un gruppo di tabelle di conversione di iconv conformi agli standard per la conversione tra eucKR ed Unicode/UTF-8. In particolare, l’intervallo obsoleto 0x3d2e-0x4dff č stato riassegnato alla regione 0xac00-0xd7ff specificata in Unicode 2.1 per Hangul.

Senza questa modifica, č impossibile condividere dati con quei sistemi che sono conformi agli standard Unicode 2.1/ISO 10646/KSC-5700.

Le conversioni di iconv interessate sono quelle tra eucKR e UCS2 oppure UTF-8.

Le tabelle di conversione di iconv interessate da questa modifica sono eucKR=ucs2 e ucs2=eucKR. Queste tabelle sono condivise dalle conversioni UCS2 e UTF-8.

Non sono previsti problemi di compatibilitą. Tuttavia, se dovessero sorgere preoccupazioni di compatibilitą riguardanti dati persistenti archiviati in Unicode (UCS2) o UTF-8 in un sistema HP-UX, si consiglia di salvare e rinominare la tabella ucs2=eucKR prima di installare questa correzione. I dati persistenti potranno essere riconvertiti ad eucKR utilizzando questa vecchia tabella e convertendoli quindi nella rappresentazione Unicode/UTF-8 corretta.

Convertitori iconv dell’associazione produttori giapponesi [11i v1.6]

Sono stati introdotti nuovi convertitori iconv per consentire una maggiore interoperabilitą della condivisione dei dati nell’ambiente di elaborazione giapponese. I seguenti oggetti sono collegati a questa modifica:

  • Sono ora disponibili nuove tabelle di conversione iconv per il giapponese, conformi alle indicazioni del gruppo di lavoro Open Group Japanese Vendor Council (TOG/JVC) CDE/Motif, che garantiscono l’interoperabilitą di ISO 10646/Unicode/JIS X0221 all’interno dell’ambiente di elaborazione giapponese.

    NOTA: JIS X0221 č lo standard nazionale giapponese equivalente ad ISO-10646:1993 e Unicode 2.1.

    Queste tabelle eseguono la conversione dei caratteri EUC e Shift-JIS (SJIS) di HP a quelli specificati nell’interpretazione rigorosa di JIS X0201, oltre alle mappature di Microsoft Unicode ed UTF-8. Le mappature di conversione di JIS X0221 Extended sono gią supportate da HP-UX. Questi nuovi convertitori richiedono 0,6 MB di spazio su disco aggiuntivo.

    La Tabella 2-26, “Nuovi convertitori iconv” mostra otto tabelle di conversione di iconv fornite per il supporto delle mappature alternative nelle conversioni nei due sensi tra EUC e Shift-JIS (SJIS) da/a Unicode ed UTF-8.

    Tabella 2-26 Nuovi convertitori iconv

    Conversione

    Interpretazione

    eucJP0201 <-> ucs2

    JIS X0201
    eucJPMS <-> ucs2Microsoft
    sjis0201 <-> ucs2JIS X0201

    sjisMS <-> ucs2

    Microsoft

     

    La Tabella 2-27, “Varianti delle mappature tra SJIS ed Unicode” mostra le varianti di mappatura tra le tabelle di conversione nella conversione tra SJIS e differenti interpretazioni delle mappature dei caratteri Unicode.

    NOTA: Le mappature JIS X0201 Extended (Unix) sono gią disponibili in HP-UX, in questa tabella si fa riferimento ad esse come SJIS.

    Tabella 2-27 Varianti delle mappature tra SJIS ed Unicode

    SJIS:

    Mappature UCS2 sjis0201 Mappature UCS2 SJIS Mappature UCS2 sjisMS

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0x8150

    0xFFE30x203E0xFFE3
    0x815F0x005C0xFF3C0xFF3C

    0x818F

    0xFFE50x00A50xFFE5
    0x815C

    0x2014

    0x2014

    0x2015

    0x8160

    0x301C

    0x301C

    0xFF5E

    0x8161

    0x2016

    0x2016

    0x2225

    0x817C

    0x2212

    0x2212

    0xFF0D

    0x8191

    0x00A2

    0x00A2

    0xFFE0

    0x8192

    0x00A3

    0x00A3

    0xFFE1

    0x81CA

    0x00AC

    0x00AC

    0xFFE2

     

    La Tabella 2-28, “Varianti delle mappature tra EUC ed Unicode” mostra le varianti di mappatura tra le tabelle di conversione nella conversione tra EUC e differenti interpretazioni delle mappature dei caratteri Unicode.

    NOTA: Le mappature JIS X0201 Extended (Unix) sono gią disponibili in HP-UX, in questa tabella si fa riferimento ad esse come eucJP.

    Tabella 2-28 Varianti delle mappature tra EUC ed Unicode

    EUC:

    Mappature UCS2 eucJP0201 Mappature UCS2 eucJP Mappature UCS2 eucJPMS

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0xA1B1

    0xFFE30x203E0xFFE3
    0xA1C00x005C0xFF3C0xFF3C

    0xA1EF

    0xFFE50x00A50xFFE5
    0xA1BD

    0x2014

    0x2014

    0x2015

    0xA1C1

    0x301C

    0x301C

    0xFF5E

    0xA1C2

    0x2016

    0x2016

    0x2225

    0xA1DD

    0x2212

    0x2212

    0xFF0D

    0xA1F1

    0x00A2

    0x00A2

    0xFFE0

    0xA1F2

    0x00A3

    0x00A3

    0xFFE1

    0xA2CC

    0x00AC

    0x00AC

    0xFFE2

    0x8FA2B7

    0x007E

    0xFF5E0xFF5E

    0x8FA2C3

    0x00A60x00A60xFFE4

     

  • TOG/JVC ha formalizzato tre possibili mappature dei convertitori per vari caratteri. Queste mappature sono:

    1. JIS X0221 in base all’interpretazione rigorosa dello standard JIS X0201

    2. JIS X0221 Extended che consente una maggiore coesistenza negli attuali ambienti basati su ASCII (come Unix)

    3. JIS X0221 basto sulle mappature Microsoft per il giapponese

Migliorie ad iconv per il supporto per l’euro per il greco [11i v1.6]

Per i dettagli sulle migliorie ad iconv per il supporto per l’euro per la lingua greca, vedere la sezione “Supporto per l’euro per il greco [11i v1.6]”.

Convertitori mainframe di iconv per i caratteri giapponesi [patch per 11.0, patch per 11i v1, 11i v2]

I convertitori mainframe di iconv tra ShiftJIS/eucJP/UCS2 e NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF, sono stati introdotti in HP-UX 11i v1.0. Questa release comprende varie correzioni degli errori di mappatura per i caratteri standard JIS.

Questa release di tabelle di conversione iconv per mainframe comprende numerose correzione di errori di mappatura per i caratteri standard JIS nelle parti basilari di queste tabelle codici per mainframe. I dettagli delle modifiche sono descritti in MFConvChanges.jips, MFConvChanges.keis e MFConvChanges.jef, nella directory /usr/share/doc.

Inoltre, questa release di metodi di conversione di iconv per mainframe comprende la correzione di un errore nella gestione di una sequenza di controllo incompleta al termine di un buffer di input.

Conseguenze per il cliente

Se il cliente ha gią utilizzato la versione di HP-UX 11i v1 dei convertitori iconv mainframe ed utilizza poi questa versione, i risultati saranno differenti a causa delle correzioni alle mappature per i caratteri standard JIS. Si consiglia di salvare e rinominare le tabelle installate in precedenza prima di installare questa release. I dati persistenti potranno essere riconvertiti utilizzando questa vecchia tabella e convertendoli quindi alle nuove tabelle nella corretta rappresentazione.

Se l’ultimo carattere nel buffer di input dovesse essere un carattere OR valido o una sequenza di controllo incompleta, iconv(3C) restituirą EINVAL. Se questo carattere dovesse essere quello finale del file di input, iconv(3C) non riuscirą a chiudere senza accodare a quel carattere altri dati fittizi come NULL. Tale carattere č 0x1a per jipsj, 0x3f per jipsec/jipsek e 0xa per keis7c/keis7k/keis8c/keis8k, che potrebbe essere un carattere OR di controllo o una sequenza di controllo incompleta.

Compatibilitą

Non sono previsti problemi di compatibilitą. Tuttavia, se dovessero sorgere preoccupazioni di compatibilitą riguardanti dati persistenti archiviati in un sistema HP-UX, si consiglia di salvare e rinominare le tabelle installate in precedenza prima di installare questa release. I dati persistenti potranno essere riconvertiti utilizzando questa vecchia tabella e convertendoli quindi nella corretta rappresentazione utilizzando le nuove tabelle.

Prestazioni

Non ci sono problemi di prestazioni.

Documentazione

  • Guida utente per l’ambiente di sistema giapponese (in lingua giapponese)

  • Manpage di iconv(3C)

Programmi futuri

I convertitori iconv per mainframe seguiranno le future modifiche nel supporto standard Unicode in HP-UX.

Versione stampabile
Informativa sulla privacy Usando questo sito si accettano le sue condizioni
© 2001-2003, 2005 Hewlett-Packard Development Company, L.P.