本文に進む 日本−日本語
日本HPホーム 製品とサービス お客様サポート/ ダウンロード ソリューション ご購入の方法
≫ お問い合わせ
詳細検索オプション
日本HPホーム
日本語環境ユーザーガイド: HP-UX サーバーおよびワークステーション > 第9章 日本語文字コード変換機能の使用方法

≫ 

テクニカル ドキュメント

PDF版
フィードバック
ここから本文が始まります

 ≫ 目次

 ≫ 索引

シフト JIS には以下の種類があります。

  • sjis : JIS X 0201:1976, JIS X 0208:1990, 外字 (85-94 区、105-120 区、合計 2,444 文字), 別名として SJIS, sjis-ASCII がある。

  • sjispc : 外字 (95-120 区、合計 2,444 文字) 以外は sjis と同じ。

  • sjishi : 外字 (85-120 区、合計 3,384 文字) 以外は sjis と同じ。

  • sjis201 : オープングループ日本ベンダ協議会 (TOG/JVC) による厳密な JIS X 0201 標準の解釈に基づく Unicode との変換規則、sjis との違いは 5 文字、別名として SJ0201, sjis-0201 がある。

  • sjisMS : オープングループ日本ベンダ協議会 (TOG/JVC) によるマイクロソフトの日本語マッピングに基づく Unicode との変換規則、sjis との違いは 9 文字、別名として SJMS, sjis-MS がある。

日本語 EUC には以下の種類があります。

  • eucJP : JIS X 0201:1976, JIS X 0208:1990, JIS X 0212:1990, 外字 (コードセット 1 : 85-94 区、コードセット 3 : 79-94 区、合計 2,444 文字)、別名として ujis, eucJP-ASCII がある。

  • eucJP201 : オープングループ日本ベンダ協議会 (TOG/JVC) による厳密な JIS X 0201 標準の解釈に基づく Unicode との変換規則、eucJP との違いは 6 文字、別名として JP0201, eucJP-0201 がある。

  • eucJPMS : オープングループ日本ベンダ協議会 (TOG/JVC) によるマイクロソフトの日本語マッピングに基づく Unicode との変換規則、eucJP との違いは 10 文字、別名として JPMS, eucJP-MS がある。

Unicode には以下の種類があります。

  • ucs2 : 2 オクテット ( 16 ビット ) での固定長符号化表現形式、別名として UCS-2BE がある。

  • ucs4 : 4 オクテット (32 ビット ) での固定長符号化表現形式、別名として UCS-4BE, UTF-32BE がある。

  • utf8 : 8 ビット構造に従った可変長符号化表現形式、別名として UTF8, UTF-8 がある。

JIS には以下の種類があります。

  • jis : インターネットで標準的に使われるエンコーディング、別名として JIS-2022-JP, JIS7, ISO-2022-JP がある。

IBM EBCDIC には以下の種類があります。

  • cp930 : IBM codepage 930, EBCDIK ( カタカナ ) と IBM メインフレーム日本語文字セット

  • cp939 : IBM codepage 939, EBCDIC ( 英小文字 ) と IBM メインフレーム日本語文字セット

  • japae : 日本語 EBCDIC メインフレーム文字セット

富士通 JEF には以下の種類があります。

  • jefc : EBCDIC ( 英小文字 ) と JEF ( 富士通メインフレーム日本語文字セット )

  • jefk : EBCDIK ( カタカナ ) と JEF ( 富士通メインフレーム日本語文字セット )

  • jefc9p : jefc で 9 ポイントで印刷文字サイズを指定する場合

  • jefc9k : jefk で 9 ポイントで印刷文字サイズを指定する場合

NEC JIPS には以下の種類があります。

  • jipsj : JIS と JIPS (NEC メインフレーム日本語文字セット )

  • jipsec : EBCDIC ( 英小文字 ) と JIPS (NEC メインフレーム日本語文字セット )

  • jipsek : EBCDIK ( カタカナ ) と JIPS (NEC メインフレーム日本語文字セット )

日立 KEIS には以下の種類があります。

  • keis7c : EBCDIC ( 英小文字 ) と KEIS78 (JIS C 6226:1978 に基づく日立メインフレーム日本語文字セット )

  • keis7k : EBCDIK ( カタカナ ) と KEIS78 (JIS C 6226:1978 に基づく日立メインフレーム日本語文字セット )

  • keis8c : EBCDIC ( 英小文字 ) と KEIS83 (JIS X 0208:1983 に基づく日立メインフレーム日本語文字セット )

  • keis8k : EBCDIK ( カタカナ ) と KEIS83 (JIS X 0208:1983 に基づく日立メインフレーム日本語文字セット )

注記: IBM EBCDIC, 富士通 JEF, NEC JIPS, 日立 KEIS のメインフレーム日本語文字セットで変換がサポートされているのは、基本文字集合 (JIS X 0208 相当 ) 部分のみです。

iconv(1) コマンドによるコード変換の例をいくつか示します。

  • シフト JIS (sjis) を Unicode (utf8) に変換 :

    iconv -f sjis -t utf8 sjis_file.txt > utf8_file.txt
  • IBM EBCDIC (cp939) を日本語 EUC (eucJP) に変換 :

    iconv -f cp939 -t ucs2 ibm_file.txt > euc_file.txt
  • NEC JIPS (jipsec) を Unicode (ucs2) に変換 :

    iconv -f jipsec -t sjis jips_file.txt > ucs2_file.txt
印刷用画面へ
プライバシー 本サイト利用時の合意事項
© 1993-2004 Hewlett-Packard Development Company, L.P.