文字コード年表 ISO 10646を中心に



加藤弘一


謹 告 
 本ページは古い情報にもとづくもので、間違いがあります。引きつづき参考として公開をつづけますが、文字コードに興味のある方は拙著『電脳社会の日本語』(文春新書)をお読みください。(2000年 4月 7日)

ISO ユニコード 日本 中国 台湾 韓国
1978 JIS C 6226
(6353字)
1979
1980
CCCII-1(4808字)
1981
基本集のGB2312(簡6763字)
1982


1983 米国、TC97で2バイトコードの国際規格制定を提案 JIS C 6226改悪!
シフトJIS誕生


1984 2バイトコード国際規格に10646という規格番号が決まり、SC2の下にWG2設置


Big5(13053字)
1985 10646の構造をめぐって、過去との互換性を重視した米国案(A案)と、真の16bitコードを目指すヨーロッパ案(B案)が対立 ゼロックス社、漢字データベースに着手。漢字統合の着想


1986


第二次簡化法案撤回 CNS11643の1〜2面(13051字)
1987 A案、B案のうち、A案可決

ECMでISO 8859制定
ユニコードという名称が誕生、シリコンバレーに広まる JIS情報部門新設でJIS C 6226はJIS X 0208に 補助集のGB7589(簡7237字)
GB7590(簡7039字)

KSC5601(4888字)
1988 収録文字数が増え、2バイトから多オクテットに。標準は4オクテットだが、1〜3オクテットへの短縮法も検討 Unicode 0.0
3500字の「現代漢語常用常用字表」と7000字の「現代漢語常用常用字表」公布
基本集に705字追加するGB 8565
統一中文内部コード開発のためにACCC発足


1989 A案に基づく4オクテットのDP 10646配布
WG3で文字名の命名法が固まるが、漢字名は未定
米国、SC2アンマン会議で Unicodeとのマージと漢字統合を提案
code@un.com設置



1990 ソウル臨時会議にユニコード関係者と台湾、香港が参加、漢字統合で激論、継続審議のために CJK-JRG設置
SC2ワシントン会議で C0/C1は使わない、文字合成はしない、漢字は各国国内規格をそのままいれると決議。情報部門の規格をIECと共同制定で合意、TC97はJTC1に改編
WG2札幌会議で中国はBMPの漢字パートにACCC作成の統合漢字(HCC)に置きかえるよう要求
DIS 10646刊行
Unicode 1.0刊行 JIS X 0212(5801字)
日本、工業技術院がソウル臨時会議に向けた対策会議
ソウル会議の結果を受け、情報処理学会にCJK-JRGのための漢字標準化専門委員会設置
伝統字基本集のGB/T12345(繁7583字)

1991 4月、DIS 10646投票。否決される。
7月、CJK-JRG東京で第一回会合
WG2ジュネーブ会議で SC2のワシントン決議を覆し、C0/C1の使用容認、文字合成容認、漢字統合を勝手に決める(事実上のUnicode化)
CJK-JRG、9月に北京会議、11月に香港会議。CJK統合漢字第一版
ユニコード・コンソーシアム正式発足 日本語EUC 伝統字補助集のGB/T 13131(繁7237字)とGB/T 13132(繁7039字) KSC5657(2856字)
1992 BMPを Unicodeといれかえた DIS 10646 1.2刊行、国際投票で可決 DIS 10646 1.2に合わせてUnicode 1.1に改訂。合成済アルファベットの採用、漢字を CJK-JRG案にいれかえる
基本集の増補集大成版ISO IR 165(簡7419字) CNS11643の3〜7面(34976字)
1993 ISO 10646-1制定




1994 サロゲートペアをUTF-16として受けいれる




1995

JIS X 0221(10646の国内化)
XKP仕様書第1版
GB13000(10646の国内化)

1996
Unicode 2.0刊行
サロゲートペア方式の拡張準備
XKP仕様書第2版 GBコードにUnicode文字を加えたGBK制定




JIS X 0208
 1987年まではJIS C 6226という名称だった。

TC97
 情報工学部門を担当していたISOの第97技術委員会(ISO/TC97)の略称。

SC2とSC2/WG2
 SC2は第97技術委員会(TC97)の下に作られた文字と文字コードを担当する第2小委員会(Sub Committee 2)。WG2は、SC2の下に作られた、2バイト(後に多オクテット)の国際文字コードの開発にあたる第2作業部会。

A案・B案
 A案は日本、中国がすでに国内規格として制定し、ISOに登録している多バイト文字コード(ISO 2022系)と互換性をたもった、2バイト(8bit+8bit)の国際文字コードを制定する案で、米国が提案。
 B案は既存の文字コードをご破算にし、まったく新規に16bitをフルに使った国際文字コードを制定するECMAの案。

多オクテット
 オクテットとは 8bitの長さのこと。普通、8bit=1バイトだが、「バイト」とはもともと一まとまりとしてあつかう単位で、7bit=1バイトや、16bit=1バイトもある。
 DIS 10646は2バイト(8+8)のコードから、4オクテット(32bit)を1バイトとするコードに改定された。
 なお、B案とユニコードは、2オクテット(16bit)を1バイトとするコードである。

IEC
 国際電気会議(International Electric Committee)の略称。以後、情報工学関連の国際規格はISOとIECの共同作業で制定することになった。「ISO/IEC」と呼ばれるのはそのため。

JTC1
 ISOとIECの第1合同技術委員会(Joint Technical Committee 1)の略称。情報工学を担当していたISOの第97技術委員会(ISO/TC97)は、ISO/IEC第1合同技術委員会(ISO/IEC /JTC1)に改編された。

CJK-JRG
 ソウル臨時会議で結論が出なかった漢字統合が可能かどうかを継続審議するために設けられた、非公式の中日韓共同研究会(China, Japan, Korea-Joint Research Group)の略称。
 日本は漢字統合の可能性を検討するだけのつもりだったが、WG2札幌会議以降、中国が漢字統合積極推進派に転じたために、中国主導で統合漢字表試案が作られ、後のSC2レンヌ会議での逆転劇の伏線となった。
 現在はIRG(Ideographic Rapporteur Group)といい、SC2/WG2の正式の下部機関となり、CJKV統合漢字の保守にあたっている。

サロゲートペア
 Unicode 1.0には約2万字分の空きがあったが、文字追加要求があいつぎ、1995年段階で16bit(65536字)ではパンクすることがあきらかになった。そこで、サロゲートペアと呼ぶ文字を上位・下位バイト用1028文字づつ用意し、二文字で一文字をあらわすことにした。最大100万字余の拡張が可能になった。

 


ISO 10646関連組織図


略称 名称 日本名 管轄
TC97
(JTC1)
Technical Committee 97
(Joint Technical Committee 1)
第97技術委員会
(第1合同技術委員会)
情報工学部門の規格
SC2 Sub Committee 2 第2小委員会 文字と符号の規格
WG2 Work Group 2 第2作業部会 多オクテット国際文字コード
CJK-JRG
(IRG)
CJK-Joint Research Group
(Ideographic Rapporteur Group)
中日韓共同研究会
(絵文字連絡会)
CJK統合漢字

(括弧の中は現在の名称)  

Copyright 1997 Kato Koiti
This page was created on Mar14 1997; Updated on Jul03 1999.



文字コード

ほら貝目次