電子テキストが正本となる社会ではなにが変り、なにが変らないかを、文字コードとテキスト処理の視点から考えた本です。
文字コードの歴史の部分は本サイトの「文字コード問題早わかり」をもとにしていますが、関係者の取材と、その後入手できるようになった資料で内容を一新しました。文字コードに興味のある方はぜひ本書を読んでいただければと思います。
文字コードは重箱の隅をつつくような話が多く、また敵味方がはっきりした世界ですので、この四年間でいろいろなことがありましたが、初期の目標が不完全ながら達成されたので、本書の刊行をもって文字コード問題から離れることにしました。これまでお世話になった皆様、来訪してくださった皆様に感謝いたします。
読者アンケートを設けましたので、御協力いただければ幸いです。
……ここに書かれている歴史や経緯は、これまでほかの資料にほとんど書かれていない貴重なものが多い。筆者の労力には頭が下がる思いがする。しかも、いくつかの異なる立場からの視点を常に持っており、冷静に現状を分析している点がよい。(『日経ソフトウェア』2000年 6月号177ページ)
……その日本語の文字コードにまつわる諸々の問題、構造、歴史、背景、確執、展望をコンパクトに圧縮して解説してくれるのが、この本である。
JISコードからユニコード、さらに『今昔文字鏡』や『超漢字』へと至る漢字処理の紆余曲折。アメリカ主導の東アジア漢字統合構想と日本・中国・韓国・台湾の熾烈な駆け引き。それ以前の漢字全廃論と漢字存続論の知られざるナショナリスティックな攻防……。
この文字コード問題が単なる「モノ書きのストレス問題」なんぞという矮小な次元のものではなく、日本語の、いや、日本人の未来に関わる大問題であることを、手を変え、品を変え、思い知らされてしまうのだった。(『アスキー』2000年 5月号289ページ)
……インターネットは、アルファベット圏の人だけのものではない。携帯電話からでも手軽にメールが送れるような現代だからこそ、漢字圏に住む日本人は文字コードにもっと関心を持つべきなのではないか。本書の最後には、古典籍の電子化に漢字圏の各国がどのように取り組んでいるかが書かれているが、そこでは日本の対応の遅れが指摘されている。このような本が新書として手軽に手に入れられることに感謝しつつ、このコラムに目を留めてくれたすべての人が手に取ってくれることを、希望してやまない。(『Dos/Vマガジン』2000年6月15日号329ページ)
タイトルと内容にずれがある。これは文字コード問題、すなわちパソコンが漢字をどう扱ってきたか、あるいは扱いそこねたかという主題に関する精密なレポートである。
最初、パソコンと漢字は相性が悪いと思われていた。初期の非力なパソコンに漢字を扱わせるためにさまざまな奇手が考案された。それが今の高性能パソコンを縛っている。そこにさまざまな立場の人間の思惑が絡む。パーフェクトな規格はまだないし、そこに近づく歩みは遅々たるものと見える。
過去の経験と現状をかくも明快に解き明かした本書の功績は大きい。ことは日本語だけに関わるのではない。世界中のすべての文字がコンピュータにどう乗るか、試行錯誤しているのだ。これは文明の継承の問題である。(『週刊文春』「私の読書日記」2000年6月22日号ページ)
要するにぼくは文字に関してもヤジウマであって、ヤジウマとしてこの本を読む。コンピュータの文字コードが話題になっているぐらいは知っているから、その状況に関心がある。ディテールについては、実務家には一大事だろうが、ぼくなんかは流れに感心するだけ。それでもインターネットの外字の扱いなんか、使っている人には当然なのかもしれないが、そんなことになっているのかと、一種異文化観光の気分で楽しむ。ヤジウマを楽しますのが新書というもの。
「あとがき」から想像すると、この問題の扱いをめぐっては、さまざまのセクトもあるようで、その政治的ドキュメントがあれば、それも読みたいなと、ヤジウマとしては思う。(『本とコンピュータ』2000年夏号110ページ)
わずか数年で我々の生活に必要不可欠になったコンピュータ。使われるのは文字コードとして登録された約6700字で日常的用途でも充分な数ではない。まだ性能が低い時代のなごりがあるという。使用される文字や漢字は何を基準に決められたのか? 文字の登録簿=文字コードについて綿密な取材をもとに考証。(『SAPIO』2002年8月7日号48ページ)
欧米の人口をしのぐ漢字文化圏
JIS漢字コードに向けて
文字概念と例示字形
文字コードをめぐる問題は情報通信技術の根幹にかかわる問題であるのに、一般にはあまり知られていない。知っているという方も、漢字がたくさん出せるかどうかの問題だろうくらいの認識にとどまっている場合が多い。
もちろん、その問題も依然としてある。筆者自身、必要な漢字が出せるかどうかという関心から、この問題にかかわるようになった。だが、調べるにつれて、もっと深刻で複雑な問題が伏在していることに気づくようになった。
本書は一九九六年一一月から翌年三月にかけて、筆者のホームページ(http://www.horagai.com/)で順次公開した「文字コード問題早わかり」を原形としている。この文章の前にも、文字コードを技術的に解説した本やホームページはいくつかあったが、なぜこういう問題がうまれたかについて、背景にまで踏みこんだものはなかったので、三年間で四章あわせて二〇万を越えるアクセスがあった。
筆者のホームページの場合、新しい文章を掲載すると、最初の一ヶ月に千から二千のアクセスがあった後、月に百から二百に下がるのが普通だが、「早わかり」だけは一章あたり月に七百前後のアクセスがつづいている。長文なので、同じ人が何度も読みに来ていることもあるが、歴史的経緯をあつかった本やホームページが他にないことが大きいかもしれない。
本書のお話をいただいた時、「早わかり」に若干加筆すればいいぐらいに考えていたが、そうはいかなかった。「早わかり」は雑誌や本、ホームページなどの断片的な情報をジグソーパズルのように組みあわせて書いたが、本書のために関係者の取材をはじめると、新事実や通説の誤りが次々と出てきて、ゼロから書き直すことになった。
許可がいただけた方は取材テープをインタビュー原稿におこし、ホームページで公開しているので、インターネット環境をお持ちの方は、ぜひ来訪していただきたい。紙幅の都合で割愛したディティールがわかり、理解が深まるはずである。
拙稿は好評をいただいた反面、文字コードで影響をうける業種の方々からは激しい反発を受けた。言論による批判ならともかく、ある業界関係者からjis支持派のホームページの内容を三日間にわたって送りつづけるという嫌がらせを受け、jis委員の方におさめてもらうという経験もした。その直後、faxの主が世話人をつとめる団体から講演の依頼があり、お断りしたところ、そのことでまた攻撃を受け、問題の根深さをあらためて知った。
技術的な解説も全面的に書き直した。「早わかり」は自分としてはわかりやすく書いたつもりで、実際、メールでもそういう感想をいただいたが、編集部から、日常的にパソコンを使っている人間にとってわかりやすいだけで、一般の読者にはわからないという指摘を受けた。
第一章で述べたように、文字コードはパソコンを使っていない人にもいやおうなく係わってくる問題である。できるだけ多くの方に問題の所在をわかってもらえるように、打ちあわせを重ね、何度も稿を練り直した。本書の図と説明は専門書のものと趣を異にするが、もし、すこしでもわかりやすくなっているとしたら、編集部のお力によるところが大きい。
細かい話は「補説」として巻末にまとめた。いずれも専門的な話題になるが、「マークアップ言語は紙を越える」と「古典の電子化」だけは目を通していただけたらと考える。
コンピュータ関係の書籍では、関連ホームページのurlを載せることが慣例になっているが、本書ではあえて掲載しなかった。ホームページの移転や廃止は日常茶飯事で、書籍にurlを収録してもリンク切れになりかねないからである。その代りに、筆者のホームページ内に本書のサポートページをもうけ、関連ページをリンクすることにした。誤植と事実関係の記載には細心の注意をはらったが、訂正点が見つかれば、サポートページに掲載する予定である。
最後になったが、取材に応じていただいた和田弘氏、林大氏、西村恕彦氏、矢島敬二氏、田嶋一夫氏、高橋眞理子氏、棟上昭男氏、佐藤敬幸氏、大島有史氏、松為彰氏、住谷満氏、田屋裕之氏、子安敏雄氏、鈴木雄介氏、加藤仁昭氏、市川浩氏、古家時雄氏、谷田貝常夫氏、石井公成氏、師茂樹氏、片岡裕氏に深謝したい。特に片岡氏には技術と言語学の両面で、長時間にわたり貴重なお話をうかがうことができた。メールないし手紙だけではあったが、和田英一氏、南堂久史氏、丹羽正之氏、野村雅昭氏、芝野耕司氏、豊島正之氏、池田証寿氏にも御教示いただいた。また、「早わかり」掲載当初は、門外漢ゆえ、多くの初歩的な誤解があったが、技術者の方々からメールで指摘していただき、多くを教えられた。編集部の笹本弘一氏には大変お世話になった。
最終的な文責は筆者にあるが、御助力いただいた皆様のお力なしには、本書のような小著といえども、まとめることはかなわなかった。重ねてお礼を申しのべるしだいである。
一九九九年一二月
加藤弘一