Wechselt zum Inhalt Deutschland - Deutsch
HP.com Deutschland Startseite Produkte und Services Support und Treiber Lösungen Kaufen
» Kontakt zu HP
Weitere Optionen
HP.com Deutschland Startseite
Informationsblatt zu Internationalisierungsfunktionen von HP-UX 11.0 - 11i > Kapitel 2 Codieren von Zeichen

Konvertieren von Codierungen

» 

Technische Dokumentation

Gesamtes Buch in PDF
» Kommentare
Text beginnt hier

 » Inhaltsverzeichnis

 » Glossar

 » Stichwortverzeichnis

Korrigierte Zeichenzuordnungen in iconv (1) und iconv (3C) [11.0 Patch, 11i v1]

Diese Version enthält Fehlerkorrekturen für falsche Zeichenzuordnungen. Die Korrekturen beziehen sich auf HP-UX Zeichen in den Sprachen Chinesisch (vereinfacht), Chinesisch (traditionell), Japanisch und Koreanisch.

Die korrigierten Zeichenzuordnungen ermöglichen eine bessere Interoperabilität zwischen Unicode-fähigen Systemen beim Senden und Empfangen konvertierter Zeichendaten.

Korrektur für Chinesisch (vereinfacht)

Mit einem Patch wird für Chinesisch (vereinfacht) eine falsche Zeichenzuordnung korrigiert, die beim Konvertieren zwischen hp15CN und Unicode (UCS-2)/UTF-8 auftritt.

Vor allem das vereinfachte chinesische Zeichen für Doppelte vertikale Linie wurde beim Konvertieren zwischen hp15CN und UCS-2/UTF-8 falsch zugeordnet. Dieses Zeichen wurde dem Zeichen Parallel zugeordnet. Dabei handelt es sich jedoch um ein anderes Zeichen.

In Tabelle 2-19, „Änderungen in iconv-Tabellen für Chinesisch (vereinfacht) “ werden die an iconv-Tabellen vorgenommenen Änderungen zusammengefasst:

Tabelle 2-19 Änderungen in iconv-Tabellen für Chinesisch (vereinfacht)

hp15CNUCS-2 (falsch)UCS-2 (richtig)Zeichenname
0xA1CE 0x2225Parallel
0xA1AC0x22250x2016Doppelte vertikale Linie
 

Die iconv-Konvertierungstabellen hp15CN=ucs2 und ucs2=hp15CN sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt.

Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnung in Tabelle 2-20, „Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (vereinfacht) “ in den richtigen Wert zu konvertieren.

Tabelle 2-20 Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (vereinfacht)

UCS-2 (alt)UCS-2UTF-8 (alt)UTF-8Zeichenname
0x22250x20160xe288a50xe28096Doppelte vertikale Linie

 

Korrektur für Chinesisch (traditionell)

Mit einem Patch werden für Chinesisch (traditionell) mehrere falsche Zeichenzuordnungen korrigiert, die beim Konvertieren zwischen Big5/EUC und Unicode (UCS-2)/UTF-8 auftreten.

Bei der Big5-Codierung von und in UCS-2/UTF-8 fehlte das Zeichen Ideografisches Leerzeichen in der Unicode-Konvertierungszuordnungstabelle:

Tabelle 2-21 Änderungen in iconv-Tabellen für Big5/Unicode

Big5UCS-2 (falsch)UCS-2 (richtig)Zeichenname
0xA140  0x3000Ideografisches Leerzeichen
 

In der folgenden Tabelle werden die an Konvertierungen zwischen eucTW und UCS-2 vorgenommenen Änderungen zusammengefasst.

Tabelle 2-22 Änderungen in iconv-Tabellen für eucTW/Unicode

eucTWUCS-2 (falsch)UCS-2 (richtig)Zeichenname
0xa1a60x30fb0x2022Aufzählungszeichen
0xa1b70x20140x2013Bindestrich
0xa1b90x20130x2014Gedankenstrich
0xa1b60xfe310xff5cVertikale Linie (vollbreit)
0xa1b80xfe320xfe31Präsentationsformat für vertikalen Bindestrich
0xa1ea 0x20320x2035Einfaches umgekehrtes gerades Anführungszeichen
0xa1eb0x20350x2032Einfaches gerades Anführungszeichen
0xa2b90x22640x2266Kleiner als über gleich zu
0xa2ba0x22650x2267Größer als über gleich zu
0xa2c20xfe660xfe65Kleines Größer als-Zeichen
0xa2c30xfe650xfe66Kleines Gleichheitszeichen
0xa2de0xff5c0x2223Divisionszeichen
0xa2e10xfe670xff0fSchrägstrich (vollbreit)
0xa2e40xffe50x00a5Yen-Zeichen
0xa2e60xffe00x00a2Cent-Zeichen
0xa2e70xffe10x00a3Pfund-Zeichen
 

Die iconv-Konvertierungen zwischen eucTW und UCS-2 oder UTF-8 sind möglicherweise davon betroffen.

Big5-Konvertierungen in UCS-2/UTF-8 sind nicht unmittelbar davon betroffen, da nur ein fehlender Tabelleneintrag hinzugefügt wurde.

Die iconv-Konvertierungstabellen eucTW=ucs2, ucs2=eucTW, big5=ucs2 und ucs2=big5 sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt.

Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnungen in Tabelle 2-23, „Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (traditionell) “ in den richtigen Wert zu konvertieren.

Tabelle 2-23 Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (traditionell)

UCS-2 (alt)UCS-2UTF-8 (alt)UTF-8Zeichenname
0x30fb0x20220xe383bb0xe280a2Aufzählungszeichen
0x20140x20130xe280940xe28093Bindestrich
0x20130x20140xe280930xe28094Gedankenstrich
0xfe310xff5c0xefb8b10xefbd9cVertikale Linie (vollbreit)
0xfe320xfe310xefb8b20xefb8b1Präsentationsformat für vertikalen Bindestrich
0x20320x20350xe280b20xe280b5Einfaches umgekehrtes gerades Anführungszeichen
0x20350x20320xe280b50xe280b2Einfaches gerades Anführungszeichen
0x22640x22660xe289a40xe289a6Kleiner als über gleich zu
0x22650x22670xe289a50xe289a7Größer als über gleich zu
0xfe660xfe650xefb9a60xefb9a5Kleines Größer als-Zeichen
0xfe650xfe660xefb9a50xefb9a6Kleines Gleichheitszeichen
0xff5c0x22230xefbd9c0xe288a3Divisionszeichen
0xfe670xff0f0xefb9a70xefbc8fSchrägstrich (vollbreit)
0xffe50x00a50xefbfa50xc2a5Yen-Zeichen
0xffe00x00a20xefbfa00xc2a2Cent-Zeichen
0xffe10x00a30xefbfa10xc2a3Pfund-Zeichen

 

Korrektur für Japanisch

Mit einem Patch werden für Japanisch vier falsche Zeichenzuordnungen korrigiert, die beim Konvertieren zwischen Shift-JIS/EUC und Unicode (UCS-2)/UTF-8 auftreten.

In der folgenden Tabelle werden die vorgenommenen Änderungen zusammengefasst.

Tabelle 2-24 Änderungen in iconv-Tabellen für Japanisch

SJISeucJPUCS-2 (falsch)UCS-2 (richtig)Zeichenname
0x81500xA1B10xFFE30x203EÜberstrich
0x815C0xA1BD0x20150x2014Gedankenstrich
0x818F0xA1EF0xFFE50x00A5Yen-Zeichen
N/A0x8FA2B70x02DC0xFF5ETilde (vollbreit)
 

Betroffene iconv-Konvertierungen sind Konvertierungen zwischen SJIS und UCS-2 oder UTF-8 sowie zwischen eucJP und UCS-2 oder UTF-8.

Die iconv-Konvertierungstabellen sjis=ucs2, ucs2=sjis, eucJP=ucs2 und ucs2=eucJP sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt.

Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnungen in Tabelle 2-25, „Zuordnung von alten und neuen Unicode-Zeichen für Japanisch “ in den richtigen Wert zu konvertieren.

Tabelle 2-25 Zuordnung von alten und neuen Unicode-Zeichen für Japanisch

UCS-2 (alt)UCS-2UTF-8 (alt)UTF-8Zeichenname
0xFFE30x203E0xefbfa30xe280beÜberstrich
0x20150x20140xe280950xe28094Gedankenstrich
0xFFE50x00A50xefbfa50xc2a5Yen-Zeichen
0x02DC0xFF5E0xcb9c0xefbd9eTilde (vollbreit)

 

Korrektur für Koreanisch

Mit einem Patch wird eine Fehlerkorrektur für Koreanisch bereitgestellt, um falsche, nicht mit den Standards übereinstimmende Unicode- (UCS-2-)/UTF-8-Zeichenzuordnungen zu korrigieren.

Die aktuell bereitgestellten iconv-Konvertierungstabellen für Koreanisch stimmen nicht mit den Standards Unicode 2.1 und ISO 10646 (mit den Ergänzungen von 1997) und dem koreanischen Standard, KSC-5700, überein. Die aktuellen Zuordnungen werden von allen bekannten Organisationen, die Standards festlegen, als veraltet betrachtet.

Die Erweiterung bietet eine Reihe von standardkonformen iconv-Konvertierungstabellen für Konvertierungen zwischen eucKR und Unicode/UTF-8. Vor allem der veraltete Bereich 0x3d2e - 0x4dff wurde dem in Unicode 2.1 für Hangul festgelegten Bereich 0xac00 - 0xd7ff neu zugeordnet.

Ohne diese Änderung ist eine gemeinsame Verwendung von Daten mit anderen standardkonformen Systemen (Übereinstimmung mit Standards Unicode 2.1/ISO 10646/KSC-5700) nicht möglich.

Betroffene iconv-Konvertierungen sind sämtliche Konvertierungen zwischen eucKR und UCS-2 oder UTF-8.

Die iconv-Konvertierungstabellen eucKR=ucs2 und ucs2=eucKR sind von dieser Änderung betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt.

Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, wird empfohlen, vor der Installation dieser Fehlerkorrektur die zuvor installierte Tabelle ucs2=eucKR zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe dieser alten Tabelle wieder in eucKR zurückkonvertiert und dann in die richtige Unicode-/UTF-8-Darstellung konvertiert werden.

iconv-Konverter des Japan Vendor Council [11i v1.6]

Es wurden neue iconv-Konverter eingeführt, die eine bessere Interoperabilität bei der gemeinsamen Verwendung von Daten in japanischen Computerumgebungen ermöglichen. Folgende Punkte sind mit dieser Änderung verbunden:

  • Es sind jetzt neue iconv-Konvertierungstabellen für Japanisch verfügbar, die mit den Empfehlungen der Open Group Japanese Vendor Council (TOG/JVC) CDE/Motif Technical Working Group übereinstimmen. Mit diesen Empfehlungen wird die Interoperabilität von ISO 10646, Unicode und JIS X0221 in japanischen Computerumgebungen sichergestellt.

    HINWEIS: JIS X0221 ist der japanische Standard, der ISO 10646:1993 und Unicode 2.1 entspricht.

    Diese Tabellen ermöglichen die Konvertierung zwischen HP EUC- sowie SJIS-Zeichen (Shift-JIS) und Zeichen, die in der strikten Interpretation von JIS X0201 sowie in den von Microsoft verwendeten Unicode- und UTF-8-Zuordnungen festgelegt sind. Die erweiterten JIS X0221-Konvertierungszuordnungen werden bereits unter HP-UX unterstützt. Die neuen Konverter erfordern ca. 0,6 MB zusätzlichen Speicherplatz.

    In Tabelle 2-26, „Neue iconv-Konverter “ sind acht neue iconv-Konvertierungstabellen aufgeführt, die alternative Zuordnungen in Round-Trip-Konvertierungen von EUC und Shift-JIS (SJIS) in Unicode und UTF-8 (und umgekehrt) unterstützen.

    Tabelle 2-26 Neue iconv-Konverter

    Konvertierung

    Interpretation

    eucJP0201 <-> UCS-2

    JIS X0201
    eucJPMS <-> UCS-2Microsoft
    SJIS0201 <-> UCS-2JIS X0201

    SJISMS <-> UCS-2

    Microsoft

     

    In Tabelle 2-27, „Abweichungen zwischen SJIS- und Unicode-Zuordnungen “ werden die Zuordnungsabweichungen zwischen Konvertierungstabellen veranschaulicht, die beim Konvertieren zwischen SJIS- und unterschiedlichen Interpretationen von Unicode-Zeichenzuordnungen auftreten.

    HINWEIS: Die erweiterten (UNIX) JIS X0201-Zuordnungen sind bereits unter HP-UX verfügbar und werden in dieser Tabelle mit SJIS angegeben.

    Tabelle 2-27 Abweichungen zwischen SJIS- und Unicode-Zuordnungen

    SJIS

    SJIS0201-UCS-2-ZuordnungSJIS-UCS-2-ZuordnungSJISMS-UCS-2-Zuordnung

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0x8150

    0xFFE30x203E0xFFE3
    0x815F0x005C0xFF3C0xFF3C

    0x818F

    0xFFE50x00A50xFFE5
    0x815C

    0x2014

    0x2014

    0x2015

    0x8160

    0x301C

    0x301C

    0xFF5E

    0x8161

    0x2016

    0x2016

    0x2225

    0x817C

    0x2212

    0x2212

    0xFF0D

    0x8191

    0x00A2

    0x00A2

    0xFFE0

    0x8192

    0x00A3

    0x00A3

    0xFFE1

    0x81CA

    0x00AC

    0x00AC

    0xFFE2

     

    In Tabelle 2-28, „Abweichungen zwischen EUC- und Unicode-Zuordnungen “ werden die Zuordnungsabweichungen zwischen Konvertierungstabellen veranschaulicht, die beim Konvertieren zwischen EUC- und unterschiedlichen Interpretationen von Unicode-Zeichenzuordnungen auftreten.

    HINWEIS: Die erweiterten (UNIX) JIS X0201-Zuordnungen sind bereits unter HP-UX verfügbar und werden in dieser Tabelle mit eucJP angegeben).

    Tabelle 2-28 Abweichungen zwischen EUC- und Unicode-Zuordnungen

    EUC

    eucJP0201-UCS-2-ZuordnungeucJP-UCS-2-ZuordnungeucJPMS-UCS-2-Zuordnung

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0xA1B1

    0xFFE30x203E0xFFE3
    0xA1C00x005C0xFF3C0xFF3C

    0xA1EF

    0xFFE50x00A50xFFE5
    0xA1BD

    0x2014

    0x2014

    0x2015

    0xA1C1

    0x301C

    0x301C

    0xFF5E

    0xA1C2

    0x2016

    0x2016

    0x2225

    0xA1DD

    0x2212

    0x2212

    0xFF0D

    0xA1F1

    0x00A2

    0x00A2

    0xFFE0

    0xA1F2

    0x00A3

    0x00A3

    0xFFE1

    0xA2CC

    0x00AC

    0x00AC

    0xFFE2

    0x8FA2B7

    0x007E

    0xFF5E0xFF5E

    0x8FA2C3

    0x00A60x00A60xFFE4

     

  • TOG/JVC hat drei mögliche Konvertierungszuordnungen für mehrere Zeichen definiert. Es handelt sich um folgende Zuordnungen:

    1. JIS X0221 basierend auf der strikten Standardinterpretation von JIS X0201

    2. Erweiterte JIS X0221-Zuordnungen, die eine verbesserte Koexistenz in aktuellen ASCII-basierten (z. B. UNIX-) Umgebungen ermöglichen

    3. JIS X0221 basierend auf den japanischen Zuordnungen von Microsoft

iconv-Erweiterungen für die Euro-Unterstützung für Griechisch [11i v1.6]

Detaillierte Informationen zu den iconv-Erweiterungen für die Euro-Unterstützung für Griechisch finden Sie im Abschnitt „Euro-Unterstützung für Griechisch [11i v1.6]“.

Mainframe-iconv-Konverter für japanische Zeichen [11.0 Patch, 11i v1 Patch, 11i v2]

Mainframe-iconv-Konverter zwischen ShiftJIS/eucJP/UCS2 und NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF wurden mit HP-UX 11i v1.0 eingeführt. Diese Version enthält mehrere Fehlerkorrekturen für Zuordnungsfehler bei JIS-Standardzeichen.

Diese Version der Mainframe-iconv-Konvertierungstabellen enthält zahlreiche Fehlerkorrekturen für Zuordnungsfehler bei JIS-Standardzeichen im Basisbereich dieser Mainframe-Zeichensätze. Eine detaillierte Beschreibung der Änderungen finden Sie in den Dateien MFConvChanges.jips, MFConvChanges.keis und MFConvChanges.jef, die sich im Verzeichnis /usr/share/doc befinden.

Außerdem umfasst diese Version der Mainframe-iconv-Konvertierungsmethoden eine Fehlerkorrektur für die Verarbeitung einer unvollständigen Shift-Sequenz am Ende eines Eingabepuffers.

Auswirkungen

Wenn ein Benutzer die Version der Mainframe-iconv-Konverter von HP-UX 11i v1 verwendet und dann diese Version einsetzt, erzielt er aufgrund der korrigierten Zuordnungen der JIS-Standardzeichen andere Ergebnisse. Es wird empfohlen, vor der Installation dieser Version die zuvor installierten Tabellen zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe der alten Tabelle zurückkonvertiert und dann unter Verwendung der neuen Tabellen in die richtige Darstellung konvertiert werden.

Wenn das letzte Zeichen im Eingabepuffer ein gültiges Zeichen ODER eine unvollständige Shift-Sequenz sein kann, gibt iconv(3C) den Wert EINVAL zurück. Wenn dieses Zeichen das letzte Zeichen der Eingabedatei ist, endet iconv(3C) nur durch Anfügen anderer Dummy-Daten (wie NULL) an dieses Zeichen erfolgreich. Dieses Zeichen lautet 0x1a für jipsj, 0x3f für jipsec/jipsek und 0xa für keis7c/keis7k/keis8c/keis8k. Dabei kann es sich um ein Steuerzeichen ODER eine unvollständige Shift-Sequenz handeln.

Kompatibilität

Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die auf HP-UX Systemen gespeichert sind, wird empfohlen, vor der Installation dieser Version die zuvor installierten Tabellen zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe dieser alten Tabelle zurückkonvertiert und dann unter Verwendung der neuen Tabellen in die richtige Darstellung konvertiert werden.

Leistung

Es gibt keinerlei Leistungsprobleme.

Dokumentation

  • JSE-Benutzerhandbuch (Japanisch)

  • Die Hilfeseite iconv(3C)

Zukunftspläne

Künftige Änderungen der Unicode-Standardunterstützung unter HP-UX werden in Mainframe-iconv-Konvertern berücksichtigt.

Druckbare Version
Datenschutzerklärung

Impressum
Mit der Benutzung dieser Website erklären Sie sich mit den entsprechenden Nutzungsbedingungen einverstanden
© 2001-2003, 2005 Hewlett-Packard Development Company, L.P.