| Deutschland - Deutsch |
|
|
|
![]() |
Informationsblatt zu Internationalisierungsfunktionen von HP-UX 11.0 - 11i > Kapitel 2 Codieren
von ZeichenKonvertieren von Codierungen |
|
Diese Version enthält Fehlerkorrekturen für falsche Zeichenzuordnungen. Die Korrekturen beziehen sich auf HP-UX Zeichen in den Sprachen Chinesisch (vereinfacht), Chinesisch (traditionell), Japanisch und Koreanisch. Die korrigierten Zeichenzuordnungen ermöglichen eine bessere Interoperabilität zwischen Unicode-fähigen Systemen beim Senden und Empfangen konvertierter Zeichendaten. Mit einem Patch wird für Chinesisch (vereinfacht) eine falsche Zeichenzuordnung korrigiert, die beim Konvertieren zwischen hp15CN und Unicode (UCS-2)/UTF-8 auftritt. Vor allem das vereinfachte chinesische Zeichen für Doppelte vertikale Linie wurde beim Konvertieren zwischen hp15CN und UCS-2/UTF-8 falsch zugeordnet. Dieses Zeichen wurde dem Zeichen Parallel zugeordnet. Dabei handelt es sich jedoch um ein anderes Zeichen. In Tabelle 2-19, „Änderungen in iconv-Tabellen für Chinesisch (vereinfacht) “ werden die an iconv-Tabellen vorgenommenen Änderungen zusammengefasst: Tabelle 2-19 Änderungen in iconv-Tabellen für Chinesisch (vereinfacht)
Die iconv-Konvertierungstabellen hp15CN=ucs2 und ucs2=hp15CN sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt. Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnung in Tabelle 2-20, „Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (vereinfacht) “ in den richtigen Wert zu konvertieren. Tabelle 2-20 Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (vereinfacht)
Mit einem Patch werden für Chinesisch (traditionell) mehrere falsche Zeichenzuordnungen korrigiert, die beim Konvertieren zwischen Big5/EUC und Unicode (UCS-2)/UTF-8 auftreten. Bei der Big5-Codierung von und in UCS-2/UTF-8 fehlte das Zeichen Ideografisches Leerzeichen in der Unicode-Konvertierungszuordnungstabelle: Tabelle 2-21 Änderungen in iconv-Tabellen für Big5/Unicode
In der folgenden Tabelle werden die an Konvertierungen zwischen eucTW und UCS-2 vorgenommenen Änderungen zusammengefasst. Tabelle 2-22 Änderungen in iconv-Tabellen für eucTW/Unicode
Die iconv-Konvertierungen zwischen eucTW und UCS-2 oder UTF-8 sind möglicherweise davon betroffen. Big5-Konvertierungen in UCS-2/UTF-8 sind nicht unmittelbar davon betroffen, da nur ein fehlender Tabelleneintrag hinzugefügt wurde. Die iconv-Konvertierungstabellen eucTW=ucs2, ucs2=eucTW, big5=ucs2 und ucs2=big5 sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt. Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnungen in Tabelle 2-23, „Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (traditionell) “ in den richtigen Wert zu konvertieren. Tabelle 2-23 Zuordnung von alten und neuen Unicode-Zeichen für Chinesisch (traditionell)
Mit einem Patch werden für Japanisch vier falsche Zeichenzuordnungen korrigiert, die beim Konvertieren zwischen Shift-JIS/EUC und Unicode (UCS-2)/UTF-8 auftreten. In der folgenden Tabelle werden die vorgenommenen Änderungen zusammengefasst. Tabelle 2-24 Änderungen in iconv-Tabellen für Japanisch
Betroffene iconv-Konvertierungen sind Konvertierungen zwischen SJIS und UCS-2 oder UTF-8 sowie zwischen eucJP und UCS-2 oder UTF-8. Die iconv-Konvertierungstabellen sjis=ucs2, ucs2=sjis, eucJP=ucs2 und ucs2=eucJP sind davon betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt. Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, besteht die Möglichkeit, ein einfaches Konvertierungsskript zu erstellen, um nach jedem falschen Wert in UCS-2 oder UTF-8 zu suchen und diesen auf der Grundlage der Zuordnungen in Tabelle 2-25, „Zuordnung von alten und neuen Unicode-Zeichen für Japanisch “ in den richtigen Wert zu konvertieren. Tabelle 2-25 Zuordnung von alten und neuen Unicode-Zeichen für Japanisch
Mit einem Patch wird eine Fehlerkorrektur für Koreanisch bereitgestellt, um falsche, nicht mit den Standards übereinstimmende Unicode- (UCS-2-)/UTF-8-Zeichenzuordnungen zu korrigieren. Die aktuell bereitgestellten iconv-Konvertierungstabellen für Koreanisch stimmen nicht mit den Standards Unicode 2.1 und ISO 10646 (mit den Ergänzungen von 1997) und dem koreanischen Standard, KSC-5700, überein. Die aktuellen Zuordnungen werden von allen bekannten Organisationen, die Standards festlegen, als veraltet betrachtet. Die Erweiterung bietet eine Reihe von standardkonformen iconv-Konvertierungstabellen für Konvertierungen zwischen eucKR und Unicode/UTF-8. Vor allem der veraltete Bereich 0x3d2e - 0x4dff wurde dem in Unicode 2.1 für Hangul festgelegten Bereich 0xac00 - 0xd7ff neu zugeordnet. Ohne diese Änderung ist eine gemeinsame Verwendung von Daten mit anderen standardkonformen Systemen (Übereinstimmung mit Standards Unicode 2.1/ISO 10646/KSC-5700) nicht möglich. Betroffene iconv-Konvertierungen sind sämtliche Konvertierungen zwischen eucKR und UCS-2 oder UTF-8. Die iconv-Konvertierungstabellen eucKR=ucs2 und ucs2=eucKR sind von dieser Änderung betroffen. Diese Tabellen werden von UCS-2- und UTF-8-Konvertierungen gemeinsam benutzt. Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die entweder in Unicode (UCS-2) oder UTF-8 auf HP-UX Systemen gespeichert sind, wird empfohlen, vor der Installation dieser Fehlerkorrektur die zuvor installierte Tabelle ucs2=eucKR zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe dieser alten Tabelle wieder in eucKR zurückkonvertiert und dann in die richtige Unicode-/UTF-8-Darstellung konvertiert werden. Es wurden neue iconv-Konverter eingeführt, die eine bessere Interoperabilität bei der gemeinsamen Verwendung von Daten in japanischen Computerumgebungen ermöglichen. Folgende Punkte sind mit dieser Änderung verbunden:
Detaillierte Informationen zu den iconv-Erweiterungen für die Euro-Unterstützung für Griechisch finden Sie im Abschnitt „Euro-Unterstützung für Griechisch [11i v1.6]“. Mainframe-iconv-Konverter zwischen ShiftJIS/eucJP/UCS2 und NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF wurden mit HP-UX 11i v1.0 eingeführt. Diese Version enthält mehrere Fehlerkorrekturen für Zuordnungsfehler bei JIS-Standardzeichen. Diese Version der Mainframe-iconv-Konvertierungstabellen enthält zahlreiche Fehlerkorrekturen für Zuordnungsfehler bei JIS-Standardzeichen im Basisbereich dieser Mainframe-Zeichensätze. Eine detaillierte Beschreibung der Änderungen finden Sie in den Dateien MFConvChanges.jips, MFConvChanges.keis und MFConvChanges.jef, die sich im Verzeichnis /usr/share/doc befinden. Außerdem umfasst diese Version der Mainframe-iconv-Konvertierungsmethoden eine Fehlerkorrektur für die Verarbeitung einer unvollständigen Shift-Sequenz am Ende eines Eingabepuffers. Wenn ein Benutzer die Version der Mainframe-iconv-Konverter von HP-UX 11i v1 verwendet und dann diese Version einsetzt, erzielt er aufgrund der korrigierten Zuordnungen der JIS-Standardzeichen andere Ergebnisse. Es wird empfohlen, vor der Installation dieser Version die zuvor installierten Tabellen zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe der alten Tabelle zurückkonvertiert und dann unter Verwendung der neuen Tabellen in die richtige Darstellung konvertiert werden. Wenn das letzte Zeichen im Eingabepuffer ein gültiges Zeichen ODER eine unvollständige Shift-Sequenz sein kann, gibt iconv(3C) den Wert EINVAL zurück. Wenn dieses Zeichen das letzte Zeichen der Eingabedatei ist, endet iconv(3C) nur durch Anfügen anderer Dummy-Daten (wie NULL) an dieses Zeichen erfolgreich. Dieses Zeichen lautet 0x1a für jipsj, 0x3f für jipsec/jipsek und 0xa für keis7c/keis7k/keis8c/keis8k. Dabei kann es sich um ein Steuerzeichen ODER eine unvollständige Shift-Sequenz handeln. Kompatibilitätsprobleme sind nicht zu erwarten. Sollten jedoch Kompatibilitätsprobleme bei permanenten Daten auftreten, die auf HP-UX Systemen gespeichert sind, wird empfohlen, vor der Installation dieser Version die zuvor installierten Tabellen zu speichern und umzubenennen. Anschließend können permanente Daten mit Hilfe dieser alten Tabelle zurückkonvertiert und dann unter Verwendung der neuen Tabellen in die richtige Darstellung konvertiert werden. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||