「文字コード問題特設ページ」も、この9月14日で開設一年をむかえました(1997年時点で)。筆者の浅学非才ももちろんありますが、問題自体が難解で広範な分野にわたっているので、記述に多くの間違いがありました。皆様からご指摘いただいた点は、できるだけ迅速に訂正するとともに、最新情報によるアップデートと、よりわかりやすくするための推敲を常に心がけてきました。
しかし、どこを直したかわからないのでは、変更前のバージョンを読まれた方にご迷惑がかかるので、開設一年を期に、主な変更については変更履歴を保存することにしました。なお、誤字脱字やURLの訂正、わかりやすくするための字句変更については、煩雑になるので、載せないことにします。
今後とも、ほら貝をよろしくお願いします。(Sep15 1997)
加藤弘一
「文字コード問題早わかり」は1996年11月に「カタカナ篇」をかわきりに順次公開し、翌年3月の「ユニコード篇」で一応の完結を見ました。
その後、『電脳社会の日本語』の取材のために関係者に直接お話をうかがったり、関連資料の収集につとめたところ、多くの新事実を発掘するとともに、通説の誤りも見つかりました。本ページにも多くの誤りがありますが、直すとしたらゼロから書き直さなければならないので、内容の更新は1998年5月を最後におこなっていません。
本ページは引きつづき参考として公開をつづけますが、文字コードの歴史に興味のある方は拙著『電脳社会の日本語』(文春新書)をお読みください。(2000年 4月 7日)
工業技術院では、現行JIS基本漢字の例示字形を変更するなどという無茶は避け、必要な字体を、別の文字として新拡張JISに登録する方針と聞く。
これは英断と評価できる。なぜ英断かといえば、JIS X 0208:1997の字体包摂の思想にしたがう限り、「なにもしない」という対処法しかないからである。
78JISの「」と83JISの「堋」は52-36という区点位置に包摂されており、互いに区別されないとするのが、JIS基本漢字第四次規格の考え方である。逆にいえば、52-36は「」でも「堋」でもよいのである。
したがって、52-36が「」になっている「印刷標準字体フォント」をインストールすれば、すべて解決ということになる。通常のフォントしかはいっていないマシンでは、依然として「堋」と表示されるが、「」と「堋」は区別しないのが 97改訂的字体包摂の原則であるから、これでいいわけである。
区別しないなら、例示字体を変えてもいいように思うかもしれないが、例示字体はあくまで例示であって、規範的に受けとめられてはならないというのが、97JISの考え方で、規格表にもくりかえし明記してある。例示字体をあえて変更したら、その字体に規範的性格があることを認めてしまうことになるのである。この点もふくめて、なにもしなくても「表試案」にすでに対応しているというのが 97JISの考え方といってよい。
それゆえ、「」に別のコードポイントをあたえることは、97改訂の破産を意味する。工業技術院は、昨年施行したばかりの JIS基本漢字第四次規格の核心部分を、みずから否定しようとしているのである。くりかえすが、これは英断である(役所の面子があるので、褒められても困るであろうが)。
問題は Unicodeである。JISだけだったら、工業技術院の判断で英断も可能になるのだが、Unicodeは欧米の企業を中心に構成されるユニコード・コンソーシアムに決定権がある。形が似ていて統合すべき文字でも、元(ソース)の規格で別字とされている文字は統合しないという原規格分離漢字規則がルールとしてあるが、台湾のCNSコードの新しい拡張は、このルールからはずされており、日本側の文字追加申請がそのまま通るという保証はない。
追加が認められたとしても、これからはいる漢字はサロゲートペアによる拡張になってしまう。サロゲートペアの実装は、来年、出てくる Unicode3.0で規定されるが、対応するOSが登場するのは、相当先になるであろう。また、すべてのアプリケーションがサロゲートペアに対応する保証もない。
おそらく、Unicodeの場合、標準フォントを「印刷標準字体フォント」に入れ替えることよって、対応するものと思われる。Unicodeは JIS基本漢字第四次規格よりもさらに大雑把な包摂(文字統合)をおこなっており、「堋」でなく「」と書きたければ、フォント切替か、Unicode3.0で追加される異体字タグを使うことになっている。こういう安易な解決法がすでにあるのに、似たような漢字を追加する必然性を欧米人に納得させるのは不可能であろう。
もっとも、Unicode製品を発売しているあるベンダーの担当者にこの話をしたところ、あきらかに狼狽していた。Unicode推進派の人々は、字体の違いはフォント切替などでいくらでも対応できると宣伝していたが、本当に別の字体のフォントを実装するようなことになるとは考えていなかったらしい(ユーザーが納得しないだろう)。
Unicode製品ベンダーが、従来の宣伝通りフォントで対応するか、それともXKPに逃げるか、おもしろいことになりそうである。
JIS漢字の規格はISOに国際登録されていますが、文字を割り当てていない空きエリアについては「shall not be used」(使用禁止)と書いてあります。国際的に日本はそう約束したのです。ところが国内規格の解説では「符号表上の予備」とかいって、ここは外字を使ってもいいエリアだと書いてしまいました。国際的には、これは使いませんと約束しながら、国内では相反することをしたわけです。(「朝日総研リポート」1998年2月号)
来年(1998年)中に出るという Win98日本語版では、外字使用が禁止されると推測しますが(確認したわけではありません)、Win98への移行がすみやかにおこなわれることはないでしょう。新しい OSにはバグがつきものですし、再学習も必要なので、Win95が登場した際は、多くの企業では移行を見合わせ、Win3.1を使いつづけています(Win95の登場から二年たっている現在でも、Win3.1を使っている企業はすくなくありません)。
というわけで、ずっと継子あつかいだった補助漢字JIS X 0212は、一度も日の目を見ないまま、消えてゆきそうな雲行きですが、一度、公的規格となった文字コードはしぶとく生き延びるのが常です。補助漢字の場合、文字コード JIS X 0212として使われることはないでしょうが、Unicodeの一部のCJK統合漢字にはいっているので、文字セットとしての補助漢字は、Unicodeの普及にともない、今後、広く使われるようになるかもしれません。