始めの言葉

「プリンターから印刷できて当たり前」と、ユーザーからもSIerからも軽視されがちなプリンターの世界ですが、実際にはお困りだったり、思ったような印刷結果が得られないまま我慢してお使いの皆様のために、今までの経験が役立てばと、このブログを立ち上げました。印刷の基本から、応用情報、問題の解決方法を情報発信すると共に、PDF化など、これからどうするかについても、ご相談に乗れれば幸いです。ご質問はコメントでお寄せください。

2015年4月13日月曜日

文字コードの話 - 文字化けではないが少し違う?新JISと旧JIS

前回までの半角文字の文字化け以外にも、印刷された文字が少し違うというケースがあります。
例えば、同じ「かご」という漢字の竹冠の下部が、「龍」ではなく「竜」が印刷されたり、その逆だったり、「ひのき」という漢字が、「檜」だったり「桧」だったりする場合です。
これらの文字は、いわゆる「新JIS規格」と「旧JIS規格」で文字コードと文字の関係が入れ替わった文字の組み合わせの一部です。「いわゆる新JIS、旧JIS」と言ったのは、「新JIS」と言っても、今から30年以上前の、1983年に行われたJISの規格の変更を境に「新」と「旧」の区別をしているからです。
下の表は、557xシリーズ・プリンターの操作マニュアルの付録からの抜粋です。「文字コード」は、Shift-JISコード、(旧)は旧JIS規格、(新)は新JIS規格を表わしています。例えば、文字コードx88B1
新JISと旧JISで文字コードが入れ替わった文字
は、魚の「あじ」を表わす漢字ですが、旧JIS規格では右側のつくりの中に、カタカナのムが3つありますが、新JIS規格では1つです。文字コードxE9CBでは、それが逆になっています。
この表の中の他の文字もそうですが、古来の正しい文字とそれを簡略化した文字の組み合わせにおいて、旧JIS規格では正しい文字が値の小さい方の文字コードに、新JIS規格では簡略化された文字が値の小さい方の文字コードに入れ替わったと言えると思います。そのような組み合わせが29組あることをこの表は表わしています。
その結果、これらの文字については、同じ文字コードをプリンターに送っても、プリンターの初期設定が「旧JIS規格」か「新JIS規格」かによって、印刷する文字が逆になってくるということになります。



その他に、新JISと旧JISの間では、新JISで文字が追加されたという違いもあります。左の表も、557xシリーズ・プリンターの
操作マニュアルの付録からの抜粋ですが、ここでは新JISで追加された文字を表わしています。
新JISで追加された文字
この表では、文字コードを、左端の4桁の英数字と1行目の1桁の英数字と合わせて表わしています。例えば、先頭の「①」は、x8740、「㈱」はx878A ということになります。「新JIS」に対応したプリンターは、これらの文字を内蔵フォントとして持っているということになります。丸で囲んだ数字や、1文 字で単位を表わした文字等は、NEC拡張文字と言って、NEC独自規格だった文字をJISに取り込んだものです。
一方、ややこしいのは、ローマ数字や、株式会社の記号「㈱」は、IBMでも、旧JISの時代から、独自に別の文字コードを定義して持っていたという点です。


(続く)






0 件のコメント:

コメントを投稿