| Deutschland - Deutsch |
|
|
|
![]() |
Informationsblatt zu Internationalisierungsfunktionen von HP-UX 11.0 - 11i > Kapitel 2 Codieren
von ZeichenUnterstützung für Unicode 2.1 [11.0 Patch, 11i v1] |
|
HP-UX unterstützt den Zeichensatz Unicode 2.1/ISO 10646 auf Systemebene. Die Unterstützung für Unicode durch Hewlett-Packard sorgt für eine Basis, die die Interoperabilität für alle Sprachumgebungen ermöglicht. ISO 10646 ist ein Industriestandard für die Definition einer Codierung, mit der alle internationalen Zeichen eindeutig verschlüsselt werden. Unicode 2.1 ist die Spezifikation für ISO 10646. Die Unicode-Unterstützung entspricht bestehenden X/Open- (OpenGroup), POSIX-, ISO C- und anderen relevanten UNIX-basierten Standards. HP-UX 11.0 unterstützt Unicode/ISO 10646 mit Hilfe der UTF-8-Darstellung (Universal Transformation Format - 8) für permanenten Speicher. UTF-8 ist eine anerkannte 8-Bit-Darstellung des Unicode-Zeichensatzes. Diese Darstellung ermöglicht eine erfolgreiche Datenübertragung über 8-Bit-Netzwerkprotokolle sowie sicheres Speichern und Abrufen von Daten innerhalb eines byteorientierten Betriebssystems wie HP-UX. Für die interne Verarbeitung verwendet HP-UX die in ISO 10646 festgelegte kanonische 32-Bit-Form (4-Oktett). Diese Unterstützung ermöglicht eine Parität mit der aktuellen HP-UX wchar_t-Implementierung, die auf einer 32-Bit-Darstellung basiert. Alle in dieser Version bereitgestellten Sprachumgebungen werden vollständig auf Systemebene unterstützt. Weitere Informationen zu den Unicode-Funktionen der asiatischen Systemumgebung (Asian System Environment, ASE) finden Sie im Verzeichnis /usr/share/doc/ASX-UTF8. Die folgenden Tabellen enthalten eine Auswahl von Binärdateien der Sprachumgebungen, die für die 32-Bit-Anwendungsverarbeitung bereitgestellt werden: Tabelle 2-13 UTF-8-Basissprachumgebungen für die 32-Bit-Anwendungsverarbeitung
Tabelle 2-14 Europäische UTF-8-Sprachumgebungen für die 32-Bit-Anwendungsverarbeitung
Tabelle 2-15 Asiatische UTF-8-Sprachumgebungen für die 32-Bit-Anwendungsverarbeitung
Legen Sie die Umgebungsvariable auf die gewünschte UTF-8-Sprachumgebung fest, um die Unicode-Unterstützung in Anwendungen zu aktivieren. Die Installation der Sprachumgebungen erfolgt auf der Grundlage der bereits auf dem Zielsystem installierten aktuellen Sprachdateigruppen. Bei einem deutschen System wird beispielsweise die Unicode-Sprachumgebung für Deutsch (de_DE.utf8) installiert. Die Quelldateien für ALLE unterstützten Sprachumgebungen (insgesamt 34) werden auch für 64- oder 32-Bit-Anwendungen bereitgestellt. Zum Erstellen von Unicode-Sprachumgebungen verwenden Sie den Befehl localedef. Weitere Informationen finden Sie auf der Hilfeseite localedef(1M). Auf den Systemen müssen die Systemkernparameter MAXDSIZ, MAXTSIZ und SHMMAX mit mindestens 100 MB angegeben sein, um eine angemessene Größe des Auslagerungsbereichs für eine erfolgreiche localedef-Kompilierung dieser Sprachumgebungen sicherzustellen. Diese Version bietet eine erweiterte Unicode-Unterstützung, um die Zeichensammlung und ISO 8859-15-Sprachumgebungen zu synchronisieren, die zwecks Euro-Unterstützung bereitgestellt werden. Dank dieser Unterstützung wird eine vollständige Interoperabilität mit der neu hinzugefügten Unterstützung für den Zeichensatz ISO 8859-15 sichergestellt. Spezielle Erweiterungen ermöglichen verbesserte Anzeige- und Eingabefunktionen für das Euro-Symbol durch Xlib und neue Schriftarten. Je nach verwendeter Sprache erfordert die Unicode-Unterstützung zusätzlichen Speicherplatz. In der folgenden Tabelle sind die Größenanforderungen für bestimmte Sprachen aufgeführt. Das auf allen Systemen installierte Unicode-Basisangebot erfordert ca. 10 MB. Tabelle 2-16 Europäische Unicode-Sprachumgebungen und lokalisierte Dateien
Tabelle 2-17 Asiatische Unicode-Sprachumgebungen und lokalisierte Dateien
Bei Anwendungen mit Unicode-Unterstützung ist die Leistung mit der anderer Multibyte-Zeichensätze vergleichbar. Wenn bei diesen Anwendungen ein Wechsel von Ein-Byte-Zeichensätzen zu Unicode erfolgt, wirkt sich dies auf die Leistung einiger zeichenbasierter Operationen aus. UTF-8 wird vom ldterm-Modul für den Streams-PTY-Treiber für Datenübermittlungssteuerverfahren unterstützt. Der Benutzer interagiert nicht direkt mit dem Streams-PTY-Treiber, da dieser innerhalb des Fensters dtterm ausgeführt wird. Über den Streams-PTY-Treiber wird ein UTF-8-Kommunikationskanal bereitgestellt, und dtterm übernimmt die Verarbeitung des UTF-8-Codes und die Anzeige der Zeichen auf dem Bildschirm. Weitere Einzelheiten finden Sie in den Modellskripts für eucset (1), ldterm (7) und lp (1). |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||