文字コード問題ホットリスト

加藤弘一

どんな文字がたりないか?

日本語 和製漢字の字典
国字(和製漢字)を集成し、画像で一覧できるオンライン字典です。一千字が公開されていますが、すでに三千字のデータ化が終わっていて、順次公開していくそうです。
日本語 JIS X 0213にない文字
「倉頡計畫」の師尾潤さんがリストアップされた JIS X 0213にない経書の文字の一覧です。『易經』44字、『書経』84字、『詩經』368字、『論語』36字で、合計474字ということです。
日本語 倉頡計畫
『論語集註』と『易經』、『詩經』、『書經』、『禮記』を公開しています。「漢文をJISで入力している理由について」では「日本語としての漢文」を公開する意義を説いています。まったく同感です。親ページの雨粟荘には易占のコーナーもあります。
日本語 十万字検索「漢楽街」
人気サイト、JAVAパズルの主宰者、藤原博文さんが ftpで公開している「漢楽街」という十万字の漢字が検索できるソフトの紹介です。漢字文化についての提言も重要です。こういう地道な活動をやっておられる方がいるとは、心強い限りです。なお、「漢楽街」はMotif対応ですから、UNIXでしか使えません。パソコン関係の本をレビューした「ちょっぴり本音の読書感想文」もお勧め。
画像 『廣集玉篇大全』
上掲の藤原さんの実家の蔵から出てきた『廣集玉篇大全』という百年前の字典の紹介で、ひじょうにおもしろいです。大きな画像がはいっていますが、モノクロでサイズが小さいので、楽に見ることができます。
日本語 今昔文字鏡研究会
リニューアルした今昔文字鏡研究会の公式サイト。もともとすぐれた検字機能を誇っていましたが、12月からはじまるリンクフリーのJIS表外字GIF画像と、1999年1月からはじまる九万字のTrueTypeフォントの無償配布によって、大文字セットのデファクト・スタンダードは今昔文字鏡に決まりと考えてよさそうです。
日本語 「今昔文字鏡」in 歴史フォーラム
Niftyの歴史フォーラムのサイトの中の「今昔文字鏡」をあつかったページです。本当に文字を必要とする人たちは「今昔文字鏡」の文字番号で情報交換をいます。
日本語 電子達磨
花園大学国際禅学研究所のホームページ。同研究所では電子仏典推進協議会を設立して、禅籍の電子テキスト化をすすめるとともに、既存の文字コードにない文字(Unicodeでも 670字以上が足りない)を国際的に共有するために、4万8千の外字を収録した「漢字ベース」という CD-Iや関連ソフトを製作・頒布しています。
日本語 「大學原解」
東北大で鋳造工学を研究されている舟窪辰也さんが、江戸時代の儒者、大田元貞があらわした「大學」の注釈書(木版本)を画像で公開したページです。二色GIFなので、一画面あたり 60Kbytes前後でおさまっており、それほど重くありません。
日本語 『三國演義』の非JIS漢字一覧
坂口丈幸さんの『三国志』ページの中にある漢字問題のページです。JIS表外漢字を拾いだし、画像ファイルで一覧し、JIS補助漢字ないし Big5にある文字は、コードポイントを併記してあります。台湾大学がフリーで公開している TrueTypeフォントを使用したとのことです。
日本語 青空文庫の外字
版権切れ文学作品の電子テキスト化をすすめる「青空文庫」が収集した外字の一覧です。
日本語 傷寒論をあなたのパソコンへ
漢方薬局を経営されている横山知史さんが提供されている「傷寒論」と「金櫃要略」の電子テキストです。JIS表外字は通し番号がふられており、外字をダウンロードするか、e漢字プロジェクトで提供されているユニコード・フォントで表示することができます。
日本語 北川外字システム
JIS X 0208の不備に業を煮やした針灸師の北川毅さんが作成した Win3.1対応の外字ライブラリを、週刊書体Watcherの佐藤さんが紹介した記事です。各方面の協力のもとに、東洋医学に必要な文字1800字を選定し、キヤノンの協力でTrueTypeフォント化したということですが、1800字という文字数は Shift-JISの制限の結果でしょうか。
日本語 漢字が足らない
「鍼灸院紹介所」内に開かれた外字問題のページです。針灸師の立場からJISコードにない漢字をどう使っていくかを模索していて、さまざまな対策が紹介されています。
日本語 CIDフォント
モリサワがAdobeSystemsの CIDフォント(Character ID Keyed Font)という新方式で開発したフォントです。従来のフォントでは、文字コードと字形データが一対一していますが、CIDフォントでは字形データに独自に ID番号をふり、その IDと文字コードを対応させます。早い話、文字コードとは別の新しい文字セットが作れるわけです。モリサワでは、この方式により、三千字余の独自拡張をおこなうそうです。
日本語 言葉 言葉 言葉
野嵜健秀氏による國語・國字問題の頁です。福田恆存、橋本進吉、山田孝雄ら、伝統派の論客の論文を公開してゐます。(Jul10 1999)
日本語 電腦正統記
國語國字問題關聯の資料を公開し、紊亂した世を憂ふる群鶏の一鶴といふべき頁でせうか。

文字コードをめぐる議論


日本語 国語審議会に対する文藝家協会からの要望書
日本の文筆家の職能団体である日本文藝家協会が、漢字の字体問題を検討している第二十一期国語審議会に対し、文字コードは日本の言語文化の存否にかかわる重大問題であり、各方面に積極的に提言するように要望した文書です。
日本語 文字コード標準体系検討専門委員会
文字コードの制定で先駆け的な役割をはたしてきた情報処理学会情報規格調査会が、ネットワーク時代をむかえて、文字コードについて根本的に検討しようとしてもうけた委員会です。文藝家協会や日本ペンクラブからも委員が出ており、公開されている議事録を見ても、活発な議論がおこなわれていることがわかります。
日本語 標準化に関する国の関与
「ほら貝」でインタビューをお願いした情報規格調査会会長の棟上昭男さんによる、公的規格はいかにあるべきかについての提言です。文字コードについては、市場ニーズのほとんどない文字は公的規格とは別の仕組を考える委員会を作ることを提案しています。
日本語 秦恒平の文学と生活
↑の「文字コード標準体系検討専門委員会」委員でもある秦恒平さんのページ。「私語の刻」に、同委員会の感想がおりにふれて書かれています。
日本語 桂重俊ページ
統計力学と情報工学の世界で業績をあげられている桂重俊さんのページです。短歌に造詣が深い方だけに、国語問題とルビについて提言されています。多くの論文が公開されていますが、中でも 1996年に国立国文学資料館でおこなわれた「コンピュータ国文学」のレポートは必読です。
日本語 中西印刷
明治三年創業の京都の老舗印刷会社、中西印刷のホームページです。同社の専務をつとめる中西秀彦さんは、印刷現場からディジタル化の問題点を指摘した『活字が消える日』(晶文社)の著者でもあります。「京都の若旦那コンピュータ奮闘記」は、印刷の業界誌に連載中の中西秀彦さんの原稿を公開したもので、著者側としては耳の痛い話がたくさんあって、勉強になります。活字文化を考える上で必読のページです。
日本語 文字講堂
南堂久史さんによる文字コード私案のページ。私案の方は現実主義的すぎて、規格としての寿命に疑問がありますが、CD-ROM版漢和辞典の外字調査やユニコードの漢字表など、資料が充実しています。
日本語 コードのはなし:追補
現在のJCS委員会で主査をつとめるあの豊島正之さんが、1995年にJALLC(情報処理語学文学研究会)の会報に発表した論文です。字体包摂の考え方の原型や、Unicode批判を知ることができ、いろいろな意味で興味深いページです。
英語 HTML4仕様原案
WWWの文法というべきHTMLを審議するWorld Wide Webコンソーシアム HTML作業部会が公開した、HTML4の仕様原案で、UnicodeをとりいれたUCSが標準文字コードになるということです。日本語版もあります。HTML4で仕様可能な文字セットについての解説もありますが、HTMLのレベルで言語指定タグをいれるそうです。結局、言語の特定は必要だったわけです(笑)。
日本語 文字化けメール根絶の野望
「インターネット経由のメールには、なぜ文字化けが多いのか?」という観点から文字コード問題を考えたユニークなページです。なぜ文字化けが起こるかの説明だけでなく、文字の化け方を分類して、各タイプごとに対処法を解説し、復元ユーティリティをリンクしてあるので、ひじょうにありがたいです。また、無料で配布されているマイクロソフト社の MSIMの問題点を指摘したページもあります。ニンニクと同じで、使っている本人はなぜ嫌われるのかわからないようですが、嫌われるだけの理由のある迷惑千万な代物なのです。インターネットの世界で鼻つまみになりたくなかったら、まともなメーラーにいれかえるべきでしょう。
日本語 MIMEとは何か?
インターネットでの情報交換を支えている MIME転送についての解説ページです。関連リンクも充実しています。
日本語 漢字袋
安岡孝一・安岡素子ご夫妻による WWW版コンピュータ異体字典。読みで検索すると、異体字や台湾・大陸中国の字体が表示されます。
画像 文字テーブル
同じく安岡孝一さんによるページで、世界のさまざまな文字コードに収録されている文字を画像として見ることが出来ます。
日本語 e漢字プロジェクト
京大人文研の勝村哲也さんと丹羽正之さんによるe漢字(電子漢字)プロジェクトのページ。Unicodeの20902字のフォントと、康煕字典の4万9千字余のフォント(3.5Mbyes以上!)と諸橋大漢和準拠の5万3千字余のフォントを無料公開するほか、フォントから漢字の画像ファイルを自動的に作る eKanji.exeがダウンロードできます。一番画数の多い漢字、画数の少ない漢字などの豆知識もあります。
日本語 日本語EUCとシフトJIS
Open Software Foudation日本支部によるページ。日本語EUCとシフトJISの関係を解説し、各ベンダーの採用している文字コードのデータが一覧できます。機種依存文字やコード範囲がずいぶん違い、コード変換と一口に言っても、一筋縄ではいかないことがよくわかります。
日本語 ボイジャー方式によるJIS外文字の表示
CD-ROM版『新潮文庫の100冊』などを製作しているボイジャーのページ。文芸作品の CD-ROMを Windowsと Macintosh両方で読めるようにすると、それぞれの外字領域の構成が一致していないために、JIS外漢字を外字コードに割り当てることができない。そこで、「☆」や「∞」、「▲」など、文学作品にはまず登場しない記号をJIS外文字でおきかえた独自フォントを CD-ROMに同梱しようという苦肉の策です。
日本語 EPWINGコンソーシァム
EPWINGは、岩波書店と富士通が共同で開発したデータベースCD-ROMのための規約です。外字指定は実体参照方式で、4bytesの内部コードのうちの2bytesで漢字の偏旁情報や、フォント切り換えによる外字情報をもたせるというものだそうです。
日本語 週刊書体Watcher
グラフィックデザイナーで、書体作家の佐藤豊さんによる定期コラムで、フォント関係のディープな話題が満載。毎週更新されていて、バックナンバーは三ヶ月ごとにまとめられています。ひじょうにおもしろいページです。書体関係リンク集も充実しています。
日本語 フォント関連用語集
フォントハウスというフォント会社が公開するフォント関係の用語事典です。「文字と書体の豆知識」というページも勉強になります。
日本語 NCALS
CIF(CALS Information Forum)という CALS推進団体のページにつくられた CALS技術研究組合のページで、工業分野の視点から文字コードについて検討しています。なお、CALSとは、工業製品の設計仕様書の書式を統一し、ネットワーク上で設計から入札まで処理できるようにしようとするプロジェクトです。
日本語 OASYSのホームページ
今でも根強い支持を受ける日本のワープロ専用機の草分け、OASYSのページですが、生みの親である神田泰典さんご自身が作っているだけに、親指シフトだけでなく、M式キーボードや TRONキーボードも紹介するなど、商売を考えない資料的価値の高い好ページとなっています。
日本語 中村正三郎の HOT PAGE
文字コード問題とは直接の関係はありませんが、コンピュータをめぐるさまざまな問題の現状を正確に教えてくれる貴重なページです。重要情報がいち早く出るので、定期的にのぞくことをお勧めします。
日本語 テクノクラフト
Robowordという多国語対応翻訳ソフトをつくっている会社のページです。翻訳ソフトといっても、ハードディスクにおいた辞典に近いもので、マウスで指すだけで単語の意味が瞬時に表示されるということです。厖大な用例辞書を使って、日本語もどきを合成するより、この方が実用になるでしょう。無料の体験版があります。文字コードとは離れますが、社員ページはどれも面白く、お勧めです。
日本語 東亜文字処理
Windows上で簡体字、繁体字、ハングルなどの多言語環境を構築するためのソフトウェアや組版ソフトを開発している会社のページです。
日本語 カナモジカイ
OASYSの神田泰典さんのページにある漢字廃止論の総本山、カナモジカイの紹介です。新興宗教っぽいですね。
日本語 新聞の漢字頻度調査
国立国語研究所の有志が、1966年の調査以来、実に30年ぶりにおこなった新聞の用字調査です。1996年度のCD-ROM版朝日新聞の記事をデータ処理したそうですから、人名異体字などは包摂した上での数字です。研究所としての正式の調査事業ではないので、利用には制限がついていますが、それにしても国立国語研究所は、この30年間、なにをやっていたのでしょうね。
日本語 東大漢字プロジェクト
日本学術振興会のプロジェクトとして進められている漢字セット作成作業の報告です。現在、十三万字が収拾され、データベース化がすすんでいるということです。電子本についての解説もあり、日本文化の未来を考える上で必読のページです。

JISコードについて

日本語 新拡張JIS ドラフト 16ドットフォント
大岩寛氏が実験的に作成し、公開している新拡張JISをふくむフォントで、250Kbytesほどあります。JIS X 0208の文字の間に収録予定文字をいれたので、フォント切り替えで使用することができます。ただし、実用には使わないようにとのことです。
日本語 JIS第三・第四水準 公開レビュー
来年度、施行予定のJIS第三・第四水準漢字・非漢字原案の公開レビュー説明資料です。巨大なPDFファイルで、ダウンロードするのも、ブラウズするのも大変ですが、現在のパソコンでは表示できない文字のリストである以上、仕方ないですね。
日本語 新拡張JIS漢字策定で検討中の文字一覧
2000年施行予定のJIS X 0213に収録される予定の文字を PDFファイル(AcrobatReaderが必要)で公開しています(257ページ、5Mバイト)。現在、漢字のみですが、非漢字もまもなく公開するとのこと。
日本語 JISコード改正原案の公開レビュー資料
JIS原案委員会が東京国際大学の FTPサイトで公開している JIS X 0208:1997改正原案の資料です。たくさんファイルがあるように見えますが、同一の文書を sjis版、euc版、さらに MS-Word ver6のファイル形式で提供しています。なお、改正の要点は /jisx0208/announce.txtにまとめられています。1バイトコードであるJIS X 0201及び図形文字の短縮識別名称を規定するJIS X 0218の公開レビュー版も同所から入手可能。
日本語 「文字コードの体系化と漢字文化」
朝日新聞社の調研談話会における芝野耕司氏の講演(「朝日総研リポート」1998年2月号130号掲載)を WWW上で公開したものです。JISの83年改悪が常用漢字表の「影響」によるものという持論をあいかわらずとなえておられますし、朝日文字をベタ褒めするかと思えば、ISO 10646原案にかかわった日本の姿勢を「サボタージュ」と斬って捨てていて、なかなかの迫力です。一時、所在がわからなくなっていたのでリンクをはずしましたが、新URLが判明したので復活させました。(Jun20 1999)
日本語 国境をこえる日本語の条件
JIS第1水準、第2水準漢字を規定したJIS X 0208は、1997年 1月に大改正をおこない、ようやく規格としてまともなものになりますが、改正の背景をJIS原案委員会の委員が率直に語りあった座談会です。文字コード問題に関心を持つ方にはぜひ見てもらいたい必見の資料です。
日本語 JIS X 0213原案委員会公式ページ
1998年公開レビューをめざして、開発が進められているJIS第3水準・第4水準文字拡張(JIS X 0213)を告知する公式ページです。現在、外字がおかれているJIS X 0208の空き領域に約2千字の第3水準文字を配置し、別に第4水準文字約3千字を選定し、JIS X 0208と同時に使うことで、現代日本語を表記する上で必要にして十分な文字セットを提供しようという画期的な事業です。公開レビューとともに無料配布するフォントをインストールすれば、システムの変更なしに、すぐに第3水準・第4水準文字が使えるようになるそうです。
日本語 JIS漢字
JCS委員である池田証寿さんによるJISコードの歴史についての解説です。JIS X 0208:1997改訂作業中にわかった JISコードのルーツについても関連史料を公開しています。

ISO 2022の世界

日本語 マルチリンガルテキスト処理 国際シンポジュウム
1998年12月17-19日に、早稲田大学で開かれたICMTP'98(マルチリンガルテキスト処理 国際シンポジュウム)のお知らせ。「ほら貝」ではこの注目すべきシンポジュウムの模様を近々紹介する予定です(→「ICMTP'98レポート」)。
日本語 国際化・多言語化テキスト処理プロジェクト
早大の片岡裕さんらのグループに進めている、ISO 2022系の国際文字コードを整備して、多言語環境を実現していこうというプロジェクトのページ。ISO 2022系=Muleの観がありましたが、X Windowを拡張することで、Muleよりも広い範囲のユーザーに使えるシステムができています。世界標準に直結するという意味では、もっとも筋のいいプロジェクトかもしれません。
日本語 全世界の文字と言語の完全混在処理環境
上記の早稲田グループによる国際環境構築に向けた論文です。文字コード問題に関する最重要の論文です。
日本語 よしだともこページ
UNIX関係のライターとして活躍されている吉田智子さんのページ。著作の一部を公開するほか、役に立つ用語事典とISO 2022関係のリンク多数。
日本語 「マルチリンガル環境の実現」
プレンティス・ホールから発売されている同名の本を紹介するページで、第一章、用語辞典などがオンラインで読めます。す。同書ではMuleとWnnの組み合わせで、多国語環境を構築するまでを詳しく解説しています。Wnnを開発したオムロン社のスタッフ自身が書いています。
日本語 JIS X 0201カナ
インターネットの世界の困ったちゃん、「半角カナ」についてのページです。「半角カナ」は、正式には JIS X 0201カナといわなければならず、その経緯もややこしいですが、興味のある方はぜひ、このページを見てください。なお、ページ・オーナーの森山将之さんは、親指シフト(正式には Nicola配列キーボード)のページも開かれています。親指ファンは必見。
日本語 ISO 8859アルファベット・スープ
ISO 8859の全文字セットを一覧できるページです。

Unicodeという提案

英語 Unicode Home Page
Unicodeコンソーシアムの公式ページ。
英語 ftp.zcu.cz
Unicode関連資料がダウンロードできる FTPサイト。
英語 Ken Lunde
Adobe Systems社の研究員で、『日本語情報処理』の著者、Ken Lundeさんのホームページ。CJK統合漢字に関する最新情報があります。
英語 Character sets and Unicode
ロンドンの IME社の Peter L. Noerrさんによる Unicodeの歴史的解説。英米人がいかに能天気で、漢字のことをわかっていないかがよくわかります。
日本語 Langage Power
東大社会科学研究所で、西垣通さんが主導している多国語WWWの実験ページです。日本語、英語、中国語、韓国語、インドネシア語の五ヶ国語から第一言語と第二言語を選ぶと、ページが二ヶ国語で表示されます。ただし、Unicodeの8bitモードであるUTF8で送っているので、Windowsの場合、98か、95のOSR2でないと表示できません。ブラウザはIE4は大丈夫でしたが、Nescape4.4では駄目でした。
日本語 Windows2000によるデーヴァナーガリ文字
Windows2000で結合音節文字でどこまであつかえるかを試したSATの師さんと祝さんによるレポートです。別売ソフトなしでも、ここまでできるとは、どこかの自称「本格的多国語環境」とは大変な違いです。(Mar29 2000)
日本語 UrabanPressの Unicodeフォント
NISSHAから出ているDTPソフト、UrabanPressで使用する五種類の Unicodeフォントの表示例を画像で紹介しています。Unicodeの説明はかなり誤解がまじっていますが。
日本語 XKP協議会
Windows NT漢字処理技術協議会の公式ページ(今までは microsoft.comにありましたが、最近、独自ドメインに移りました)。WindowsNTは Unicodeということになっていますが、Unicodeをそのまま実装するわけではありません。Unicodeの2万字の漢字のうち、最大でも1万4千字しか実装せず、残りの文字や異体字はUDC Serverと呼ばれる外字ライブラリをつくり、そのライブラリをOLEなどでWindowsから利用するというややこしいことをやるようです。XKPとは eXtended Kanji Processingの略で、構内ネットワーク上で共有外字ライブラリを利用するための技術の総称です。XKP参加企業は、マイクロソフト社の公共サービス部門とともに、人名異体字を必要とする地方自治体にXKPの猛烈な売り込みをかけているようです。
日本語 XKP仕様書
XKP開発にかかわっている(株)ピーデーのサイトで公開されているXKPの仕様書です。XKPに関係している企業にはそれぞれの思惑があるらしく、関係者の発言やXKP協議会の公式発表の中にも事実にもとづかない情報が混じっているようなので、正しい姿を知るためには仕様書を読むことが必要です。
日本語 地方公共団体の向け情報誌
MSKKが地方公共団体に WindowsNTによるネットワークを売りこむために発行している「PSLG」という情報誌のオンライン版です。人名異体字を外字で外字で表示する XKPが、地方自治体攻略の武器に使われていることがよくわかります。
日本語 国境の内なる文字たち
Super ASCIIで Unicodeの記事を連載された上田純美礼さんによる Unicode関連資料のリンク集です。一年以上、更新がなく、うちからはアクセスできないものが多いのですが、どうなっているのでしょう。
日本語 Unicodeとユーザ定義文字・ベンダ定義文字に関する問題点と解決策
Open Software Foudation日本支部によるページ。Unicodeは外字の使用を前提に設計されていますが、コード変換をする上での問題点を指摘し、解決法を提案しています。XKP批判も一読の価値あり。

電子図書館という提案

日本語 国会図書館の文字取り扱いの変更
1998年に変更された『日本全国書誌』やJapan/MARCに収録された書誌レコードの文字種の新たな取り扱いについての解説。
日本語 資料の保存に関する調査研究班設置要綱
図書館情報大のサイトで公開されている「国立大学図書館協議会」の報告で、酸性紙対策の緊急性を訴えています。
日本語 南の島の図書館通信
「南の島」ならぬ世田谷中央図書館に勤務されていた大塚敏恒さんによる、図書館情報のページ。先進的な試みをしている図書館の見学記など、その道の人の視点が光ります。
Copyright 1999 Kato Koiti
This page was created on Sep02 1996; Last updated on Jul10 1999.

文字コード
ほら貝目次