ダイナフォントストーリー

カテゴリー:連載コラム「ぬらくら」
2023/03/23

ぬらくら第144回「漢字文化圏の文字事情 (* 1)」

日本以外で漢字を使っている国と地域には台湾、香港、中国、韓国 (* 2)、ベトナム (* 3) などがあり、これらの国・地域を漢字文化圏として見ることができます。

当然のことですが漢字を使っている(あるいは、いた)と言っても、それぞれの国・地域によってその実情は異なります。特に漢字からカタカナやひらがなを創り出した日本は独自の文字文化をもち、漢字の形 (* 4) も他の漢字を使用している国・地域とは一線を画すものがあります。

日本の文字事情については既に多くの論が発表されているので、ここでは他の漢字使用圏の事情を探ってみることにします。

『所変われば品変わる』ではありませんが、日本語の「飛行機」を台湾では「飛機」、中国では「飞机」、「空港」はそれぞれ「機場」と「机场」と書きます。どちらも中国語圏共通の話し言葉である普通話(pǔtōnghuà/中国標準語。日本では北京語と呼ばれている)では、「飛機」も「飞机」も “fēijī”、「機場」と「机场」は “
jīchǎng” と読みます。

(成田国際空港)
成田国際空港

中国語圏は何処に行っても話し言葉として普通話が普及していますが、文字のことになると事情は異なります。同じ中国語圏なのに、なぜ台湾と中国では「飛行機」や「空港」を現す文字の形に違いがあるのでしょう。

中国語を表記する漢字の体系には大きく分けて二つあります。

一つは主に台湾で使われている古典的な字体(繁体字)の体系、もう一つが中国で使われている簡略化された字体(簡体字)を含む体系です。繁体字は台湾の他に香港とマカオが使っています。簡体字を使っている国には中国の他にシンガポールとマレーシアがあります。

繁体字は、漢字を構成する要素が省略されていない伝統的な字体です。地域によって微妙な違いがみられますが、おおむね日本の旧字体 (* 5) に見られる形と同じだといってよいでしょう。

以下、順に見て行きましょう。

◉ 台湾

1973年に台湾の教育部は漢字の標準化を進めるために漢字の整理作業に着手しました。1982年には 4,808字を収録した「常用国字標準字体表」と、6,341字を収録した「次常用国字標準字体表」を制定します。その後、1998年までに数度の部分修正が行われました。公文書や国民小学・国民中学の教科書などはこれらの字体表を採用しています。 1995年には「常用国字標準字体筆順手冊」によって漢字の標準的な筆順も定められました。

1991年に教育部は「常用国字標準字体表」ならびに「次常用国字標準字体表」に含まれる漢字を印刷業界・情報処理業界に普及させるために、華康科技(現・威鋒數位開發股份有限公司/DynaComware Taiwan Inc.)に標準字体表に則った楷書体、明朝体、ゴシック体、隷書体それぞれの字体を示す「国字標準字体母稿」の制作を委託しています。

1984年に台湾の資訊工業策進会(Institute for Information Industry)が制定した「電腦用中文字型與字碼對照表」という文字集合の規格があり、これを Big5 と呼んでいます。これは当時の台湾の五大パソコンメーカー、エイサー(宏碁)、マイタック(神通)、佳佳、ゼロワン(零壱)、FIC(大衆)が共同でこの規格を策定したことに由来しています。この時の Big5 を、後に拡張された Big5 と区別するために Big5-1984 と呼ぶことがあります。

Big5-1984 はローマ字、アラビア数字、蘇州号碼 (* 6)、記号類、注音符号 (* 7) のほか、漢字 13,062字を収録しています。そのうち2字が重複しているので、実際の漢字の収録文字数は 13,060字です。台湾や香港、マカオなどの繁体字を利用している地域で普及しています。MS-DOS (* 8) 時代の「中国語システム(中文系統)」や Windows、Mac OS といったオペレーティングシステムで採用されたことで、デファクトスタンダードとして定着しました。

Big5 には、Windows 95 以前に普及していた中国語システム、倚天中文系統 (* 9) の「Big5-Eten」、中文數位化技術推廣基金會(Chinese Foundation For Digitization Technology, CMEX, 中推会)が「BIG5碼字集擴編計畫」に基づいて ISO/IEC 10646:1993 (* 10) の漢字をすべて収録した「Big5+」、Big5 の外字エリアに収まるように「Big5+」から政府機関が使用する 3,954字を選定・収録した「Big5E(Big5碼補充字集/Big5 Extension Character Set)」など、拡張された Big5 も生まれています。

2003年、中推会は中華民国国家標準を所管する経済部標準検験局の委託により、関係する事業者・専門家を集めて Big5 の対照表を作成して、これを次に述べる CNS 11643 の附属書とすることを答申して採用されます。このことにより Big5 は Big5-2003として正式に公的規格の一部となります。その収録文字数は 13,943字です。

台湾の文字集合規格には Big5 の他に、公的な規格として制定された「CNS 11643 中文標準交換碼 (Chinese Standard Interchange Code)」があります。

1982年に教育部が常用・次常用の「国字標準字体表」を制定したことに伴い、公的な文字集合規格として CNS11643 を制定しました。1983年に試用版が発行され、二年間の試用期間を経て、1986年に ISO/IEC 2022:1994 (* 11) に適合させた13,735字を収録して最初の正式判としました。

2016年以降更新されていなかった CNS11643 ですが、2022年4月に 108,629字を収録した最新版が発表になっています。

Big5 や CNS11643 には中国で使用されている簡体字は含まれていません。

(図-1 蘇州号碼 赤下線部分)
蘇州号碼
(図-2 注音符号 赤下線部分)
注音符号
◉ 香港

香港はその歴史的な背景と経緯から繁体字を使っている地域で、文字集合としても Big5 を採用しています。

香港における常用漢字の字体の見直しは 1984年7月に始まりました。当時の香港教育署語文教育学院中文系の李学銘教授が学内の研究の中心となって関係資料の収集・分析に当たっています。同時に学外の研究者たちと常用字標準字形研究委員会を開き、個別の字について標準字体の審査に当たりました。こうして 1985年9月に字体の見直しが完了し、1986年9月に「常用字字形表」が策定されました。

「常用字字形表」は 4,762字の常用漢字の標準字体(繁体字)を収録しており、香港の初等・中等教育の教科書に用いられています。この字体表に収められている字形は常用字字形表字形、香港教育字形、常用字教育字形などと呼ばれています。

「常用字字形表」はもともと小学校の国語教師を対象とした参考資料でした。
この字形表の策定は、国語教師が直面する異体字の多さによる識字教育の困難を軽減することが目的で、権威的な正字体系を打ち立てようとしたものではありませんでした。そのために、教師には、児童生徒が「常用字字形表」に無い通行の異体字を用いたとしても誤字とするのではなく、寛容な態度をとることが望まれていました。
しかし、香港教育署が1988年に頒布した「小学中国語文科課程綱要(初稿)」付録の「小学常用字表」で「常用字字形表」に基づいた字体解説を行ってから、出版社はそれに倣って「常用字字形表」を標準字形とする字典や教科書を販売するようになりました。

「常用字字形表」は 1990年および 2000年の再版時に全面的に改訂されています。

1995年、香港政府は政府省庁間の電子通信を円滑にするために、Big5 を補完する形で政府省庁がコンピュータで使用するために必要な地域特有の漢字を含む文字集合「政府通用字庫 (Government Common Character Set/GCCS)」を制定します。
GCCS は、初めのうちは省庁内部のみで利用されていましたが、政府が発行する電子情報に市民がアクセスしやすくするために、後にこれを政府のホームページ上で公開しています。

当時の資訊科技署は、地域固有の漢字を共通化することが国民にとって有要であるとして、1998年に法定語文事務署と共同で GCCS を改訂します。その内容は、各界からさらに地域固有の漢字を収集し、GCCS に収録・拡充を図って公開することでした。

1999年、香港特別行政區政府は中文界面諮詢委員會(中諮會/Chinese Language Interface Advisory Committee/CLIAC)と協力して GCCS の改訂を完了し、その名称を「香港增補字符集 (Hong Kong Supplementary Character Set/HKSCS)」と変更します。

HKSCS の最初のバージョンの収録文字数は 4,702字で、以降、次のように改定が重ねられています。

 HKSCS-2001:HKSCS に 116字追加し、収録文字数は 4,818字になる。
 HKSCS-2004:HKSCS-2001 に 123字追加し、収録文字数は 4,941字になる。
 HKSCS-2008:HKSCS-2004 に 68字追加し、収録文字数は 5,009字になる。
 HKSCS-2016:HKSCS-2008 に 24字追加し、収録文字数は 5,033字になる。

HKSCS-2016 の発行以降、今日までに3字が追加されて収録文字数は 5,036字になっていますが、HKSCS の最新のバージョンの呼称は HKSCS-2016 のままです。

HKSCS にはひらがな、カタカナが含まれています。

(図-3 HKSCSのひらがな)
HKSCのひらがな
(図-4 HKSCSのカタカナ)
HKSCのカタカナ
◉ 中国

1955年、中国政府は日常生活における異体字の混乱を排除するために「第一批異体字整理表」を制定し、続く1956年には漢字の作り方を規定した「漢字簡化方案」を制定します。

1964年、これまでの漢字表をとりまとめて整理した「簡化字総表」が制定されます。この表は漢字を体系的に簡化 (* 12) できるよう、簡化の法則を明確に定めたものです。この中で、最初に独立文字にしか適用できない簡化字 352字を定め、次に任意の文字部位に適用できる簡化字 132字を、そして部位としてのみ簡化できる 14 の文字部位を明確にしています。これにより任意の漢字が簡化できるようになりました。

1965年、この簡化規則に基づいて字形を康煕字典体のものに少し変更を加えた「印刷通用漢字字形表」6,196字が公布されました。この表では字形にそれまでの康煕字典体を簡略にした字形が採用されています。たとえば「爲」は「為」に、「爭」は「争」に、「奐」は「奂」などです。これらはあくまでも字形の変更で「簡化」とはみなされていません。

「簡化字総表」に基づいて簡略化された簡体字を簡化字と呼ぶことがあります。
ここでややこしいのは、市井一般に手書きによって簡略表記される漢字も簡化字と呼ぶことがあることです。簡体字は国家規格で制定された漢字であり、「戈」の中に「二」と書いて(IDS:⿹戈二)「贰」に当てるような、手書きによる簡略化された簡化字は国家規格には含まれていません。

1981年、中華人民共和国国家標準総局は文字符号規格として GB 2312-80「信息交换用漢字編碼字符集 基本集」を制定します。GB は「国家標準」を中国語読みした時の音声 “Guójiā Biāozhǔn” から G と B をとって、国家標準を表しています。

この規格は「印刷通用漢字字形表」の文字を含む各種記号、丸数字、ローマ数字、英数字、ひらがな、カタカナ、ギリシア文字、キリル文字、声調符号付き拼音字母、注音符号といった非漢字 682字、特に使用頻度の高い漢字を一級漢字として 3,755字を、比較的使用頻度の低い漢字を二級漢字として 3,008字の合計 7,445字を収録しています。
収録された漢字には「印刷通用漢字字形表」の 6,196字と、一般に使用する漢字の 99.99パーセントをカバーするとされる 567 の漢字を加えた、簡化字 6,763字を含んでいます。

この文字集合には当時の最高指導者、鄧小平の「鄧」の簡体字「邓」だけが収録され、正字とされる「鄧」が収録されておらず、GB 2312 を利用するに際して当事者は不都合を感じていたという逸話があります。

1993年、ISO/IEC 10646:1993 を中国語訳した GB 13000.1-93 が発表になります。この規格に収録された文字数は 20,902字です。

1995年、国家技術監督局標準化司と電子鉱業部科技与質量監督司は GB 2312 を拡張した「漢字内碼拡展規範」を策定します。GB 2312 の拡張版という意味で GB に K を付してGBK と呼ばれています。これには繁体字も収録されており、その収録文字数は Unicode (* 13) のCJK統合漢字 (* 14) をすべて取り込んだ21,886字です。

ネットワークに接続したコンピューターで情報を交換することが普及してくると、新たな問題が顕在化してきました。本来は同じ字形であるべき文字が、地域によって異なるという事象が現れてきたのです。このことが契機の一つになって、新たな文字規格の策定が始まり、2000年になってその遵守が求められ、同時に強制力を持った文字規格 (* 15) が生まれました。

それが、2000年に国家質量技術監督局によって制定された「GB 18030-2000 信息技術 信息交換用漢字編碼字符集 基本集的拡充」です。これは広く普及した GB 2312-80 の上位互換規格で、繁体字を含む 27,484字と ASCII (* 16) が規定されています。

2005年、中華人民共和国国家質量監督検験検疫総局と中国国家標準化管理委員会は共同で GB 18030-2000 を拡張・改訂した「GB 18030-2005 信息技術 中文編碼字符集」を発表し、2006年5月1日より施行されました。
これには簡体字・繁体字のほか、ウイグル、カザフ、チベット、モンゴル、イ (* 17) など少数民族言語の文字や、やひらがな、カタカナ、ハングル、ASCII を含んでいます。収録文字数は 76,546字、その内、漢字は 70,244字です。

(図-5 イ文字の一部)イ文字の一部
2022年7月19日に国家市場監督管理総局と国家標準化管理委員会は共同で GB18030-2005 を改訂した「GB18030-2022 信息技術 中文編碼字符集」のドラフト(国の承認機関の承認を得るまでに部分的な変更の可能性が残されている)を発表します。この規格の施行日は2023年8月1日の予定と発表されています。

この規格に収録されている文字数は 94,884字です。
その内訳は ASCII が 128字、図形・符号類 894字、漢字 20,988字、少数民族(ウイグル・カザフ・キルギス・チベット・モンゴル・シーサンパンナタイ・イ・リス・朝鮮・ミャオ)言語の文字 5,732字、康熙字典の部首 214、CJK 統一漢字 66字、CJK 統一漢字拡張 66,847字です。

GB18030-2005 から変更になる部分には少数民族言語の文字の追加・削除があります。他に、康熙字典の部首 214、CJK 統一漢字 66字、CJK 統一漢字拡充 C から F までの 17,606字が追加されます。そしてこれが一番大きな変更点ですが、この規格の実装レベルを一、二、三の三段階に分けて規定している点です。以下はドラフトからの抜粋です。

○実装レベル一
一バイト符号化部(ASCII)、二バイト符号化部(図形・符号、漢字)、四バイ ト符号化部(少数民族言語、康熙字典部首、CJK 統一漢字、CJK 統一漢字拡張)の CJK 統一漢字とCJK 統一漢字拡張 A をサポートすること。この規格書が適用される製品は実装レベル一の要件を満たさなければならない。ソフトウェアの必要性に応じて四バイト符号化部から一つ以上の非漢字文字集合を実装することも可能とする。

○実装レベル二
実装レベル一を含む他「一般規格漢字表」の 8,105字をサポートすること。
システムソフトウェアおよびサポートソフトウェアは、少なくとも実装レベル二の要件を満たしていること。これには、オペレーティングシステム、データベース管理システム、ミドルウェアが含まれるが、これらに限定されない。

○実装レベル三
実装レベル二を含む。また、実装レベル三は、本書で規定するすべての漢字と康煕字典の部首をサポートすること。政府および公共サービスで使用される製品は、レベル三を実装すること。政府および公共サービス産業には、鉄道輸送、道路輸送、水上輸送、航空輸送、複合輸送・海運代理店業、郵便産業、貨幣および金融サービス、保険、土地管理、健康、国家機関、社会保障などが含まれるが、これらに限定されない。

◉ 韓国

國之語音、異乎中國、與文字不相流通、故愚民、有所欲言、而終不得伸其情者多矣。
予為此憫然、新制二十八字、欲使人人易習、便於日用耳。

(我が国の語音は中国とは異なり、漢字と互いに通じることがないので、漢字を知らない民は言いたいことがあっても、その情を述べることもできずに終わるものが多い。予はこれを憐れに思い、新たに二十八字を作った。人々が簡単に習い、日々用いるのに便利にさせたいだけである。)

これは、李氏朝鮮第四代王世宗(1395−1450)が「訓民正音」(* 18) の中に自ら記している一文です。

「訓民正音」は1443年に、世宗がそれまで休眠状態だった「集賢殿(学問研究機関)」を再生して、当時の朝鮮最強の頭脳集団ともいうべき八名 (* 19) を招集し、1446年に公布した朝鮮独自の文字体系です。

訓民正音は人が発する音声を基に作られています。モノの形から生まれまた漢字やアルファベットとはその点が大く異なります。訓民正音は近代の先駆的な朝鮮語学者、周時経(1876−1914)によってハングル(偉大なる文字)と名付けらます。

以降、ハングルは漢字と共に使用され普及していきます。

時代は下って第二次世界大戦が終結(1945年)すると、米軍政庁の主導で「ハングル専用法」が制定され、ハングル専用政策が推進されます。これは日本による植民地時代から、ハングルで民族意識を確立させようとした「朝鮮語学会」のハングル学者を中心に展開されたものでした。

以下にハングル専用とハングル・漢字併用の推移を概観してみます (* 20)。

1961年:朴正熙、全斗煥、盧泰愚などが主導した軍事政変が起こり、翌 1962年には文教部が「ハングル専用」を建議して「ハングル専用特別審議会」が設置される。
1968年:大統領令第 3925号によって教育漢字 1,300字が廃止される。
1969年:「国語文教育研究会」が発足し、教科書漢字廃止の中止を要求する。
1972年:中学校 900字、高等学校 900字の漢字教育が復活し、教育用基礎漢字 1,800字が制定される。
1975年:中学校・高等学校の教科書にハングルと併用して漢字が登場する。
1999年:政府は「ハングル専用法」内で漢字併用推進方案を発表すると共に、政府公文書と道路標識に漢字を併用する。
2005年:「国語基本法」が制定され「ハングル専用法」は廃止される。「国語基本法」は完全なハングル専用という訳ではなく補助語併記を許容している。同法は私的文書のハングル専用を強制していない。しかし、ハングル専用が定着して 1988年には漢字を使わない日刊紙「ハンギョレ新聞」が創刊された。 2012年:学生の保護者と大学教授、漢字・漢文講師などが「公文書のハングル専用作成を規定した国語基本法は違憲」として憲法訴願を出したが、2016年、憲法裁判所は裁判官全員一致で同法規定を合憲とする。

2023年現在、中学校および高等学校で選択教科ではありますが「漢文」という科目で 1,800字の漢字を教えています。しかし、現在の韓国では日常生活で漢字を用いることはありません。

こうした背景を踏まえて、韓国の文字集合規格の推移を見てみましょう。

韓国の文字集合規格は韓国、北朝鮮、中国によって開発され、1974年に KS C 5601 として制定されます。そこには漢字も収録されています。

科学技術省は 1974年に韓国科学技術院に国家文字集合の標準化を委託しました。この委託によって、韓国初の国産文字セットである “KS C 5601:1974 Code for Information Interchange (Hangul and Hanja)” が誕生することになります。

政府は 1980年に韓国語の文字セットの再評価を行うために、標準草案を設計するタスクフォースを設置します。タスクフォースは 1981年5月から 1982年1月まで標準化の作業に取り組み、1982年1月にドラフトを完成させ、1982年5月に新しい国家文字集合標準である KS C 5601:1982 を策定します。

Jamo(ハングルを構成するエレメント)によって構成されたハングルのセットは、1986年に発行された KS C 5601:1987 によって標準化されます。

KS C 5601:1987 は1992年の改訂で KS C 5601:1992 となります。
KS C 5601:1992 はハングル 2,350字、漢字 4,888字、英数字や平仮名、片仮名など 986字の合計 8,224字を収録しています。4,888の漢字のうち、複数の読みがある漢字 268字が重複して収録されています。

1997年、韓国国家標準に新たに情報部門 (X) が新設されたことに伴い、KS C 5601:1992 は KS X 1001:1992 と改番されましたが、収録文字数は変更されていません。
1998年、KS X 1001:1998 が制定され、€(ユーロ記号)と®(登録商標)の2字が追加されます。
2002年、KS X 1001:2002 が制定され、韓国郵便記号1字が追加されます。収録文字数は 8,227字になります。
2004年、規格書中の紛らわしい用語、不正確な用語などを訂正した KS X 1001:2004 が発表されていますが、収録文字数に変更はありません。

KS X 1001 を補完する文字集合として 1991年に制定された KS X 1002:1991(旧KS C 5657)があります。この規格にはハングル 3,605字、漢字 2,856字、ラテン・記号類など 1,188字の合計 7,649字が収録されていますが、ほとんど普及を見ないまま、現在まで改訂されていないようです。

(図-6 KSX1001の仮名)
KSX1001の仮名
(図-7 KSX1001の漢字の一部)
KSX1001の漢字の一部
◉ 北朝鮮

北朝鮮には 1997年に制定された独自の文字集合規格 “KPS 9566-97 DPRK Standard Korean Graphic Character Set for Information Interchange” があります。DPRKは “Democratic People's Republic of Korea” の略です。
KPS 9566-97 は韓国の KS X 1001:1992 との類似点が多いですが、一部に異なる点もあります。
収録文字数はハングル 2,679字、漢字 4,653字、英数字や平仮名、片仮名など 927字の合計 8,259字ですが、KS C 5601:1992 が重複して収録している漢字 268字は重複収録していません。

文字コード表(Character Table)の四行目には重複して登録された Jamo ではない六つのハングルがあります。そのうちの三つは北朝鮮の元指導者・金日成の名前、김일성(gim il seong)で、続く三つは現在の指導者・金正日の名前、김성일(gim cheong il)です。よく見ると、성일(cheong il)は일성(il seong)の前後を入れ替えた表記であることが見て取れます。

똠방각하(ttombang gakha)という本の名前に使われている똠(ttom)は、KPS 9566-97 には登録されていますが、韓国の KS X 1001:2004 には登録されていません。Unicode はこれを U+B620 に収録しています。똠방각하は『我こそは最高なり』あるいは『不遜で身勝手な人』という意味だそうです。

(図-8 KPS

9566の金日成と金正日、仮名の一部(仮名は分散して収録されている))
KPS 9566の金日成(4行72列-4行74列)と金正日(4行75列-4行77列)、仮名の一部(仮名は分散して収録されている)
(図-9 KPS 9566の漢字一部)
KPS 9566の漢字一部
◉ ベトナム

ベトナムはその立地ゆえか十世紀の建国をみた後も漢・唐の影響を受け続け、中国語と漢字文化の強い影響を受け続けました。そのため、ベトナムの古典や歴史的な記録の多くは、漢字(漢文)で書かれています。ベトナム現代語の辞書をみても、単語の70パーセント以上が漢字由来の単語で、漢字表記が可能だそうです。

ベトナムは 1075年に中国の科挙制度を取り入れています。
ハノイに残る「文廟・国子監」には、1442年から 1779年の間に実施された国家試験(会試)に合格した 1,304人の名前と出生地を漢字で刻んだ碑が残っています。ベトナムの科挙制度は 840年余り続きましたが、1919年に廃止されています。

中国の支配下、民族意識の高まりと共に、漢字を元にしたベトナム独自の文字「字喃(Chữ Nôm/チュ・ノム)」が作られます。その時期は十世紀から十三世紀頃とされ諸説あります。チュ・ノムはベトナムで作られた表意文字で、後に制定される文字集合規格には部首、画数の順で収録されています。

1919年、科挙制度の廃止とその後のフランスによる植民地化、フランス総督府によるチュ・クオック・グー (* 21) 教育の推進によって漢字とチュ・ノムの使用頻度は減少していきます。
1945年、ベトナム民主共和国の成立により、ベトナムの国字として漢字に代ってチュ・クオック・グーが正式に採択されます。
1954年、公式に漢字の使用が廃止されましたが、テト(旧正月)や中秋節などの伝統行事、仏事、冠婚葬祭などには今でも漢字の使用が見られます。

1993年、“TCVN 5712:1993 Vietnamese 8 bit Standard Coded Character Set for Information Interchange (VSCII)” が制定されます。TCVN 5712:1993 (VSCII) はVSCII-1、VSCII-2、VSCII-3から成っています。TCVN はベトナム語で「ベトナム国家規格」を意味する “Tieu Chuan Viet Nam” の頭文字です。

VSCII-1 は、制御文字 23字、記号類 33字、英数 62字とチュ・クオック・グーの全ての 138字の合計 256字を規定しています。
VSCII-2 は、VCII-1 から 32 の声調符号付き大文字を削除した内容になっています。
VSCII-3 は、VSCII-2 からさらに 16 の声調符号付き大文字と五つの声調符号を削除した内容になっています。

TCVN 5712:1993 が制定された同じ 1993年、TCVN 5773:1993 が制定されます。
ここには漢字 2,357字が収録されていますが、この中の 38字が重複しています。収録されている文字のうち約 600字が中国語由来とされる漢字で、それ以外はチュ・ノムです。これらの文字は部首、総画数の順に配列されています。

1995年、3,311字の中国由来の漢字を収録した TCVN 6056:1995 が制定されます。この規格にはチュ・ノムは含まれていません。また、TCVN 5773:1993 で重複が確認されている 38字は削除されました。これらの文字は部首、総画数の順に配列されています。

2009年から 2010年にかけて、科学技術省標準・計量総合局標準技術委員会によって国際標準規格 ISO/IEC 10646 に準拠した “TCVN 8271 Information technology - Vietnamese Encoded Character Set” が発表されました。

TCVN 8271 は次の六つのパートで構成されています。

TCVN 8271-1:2009 この規格の全体像を示している。
TCVN 8271-2:2009 チュ・ノムの文字集合で 10,412字を収録している。
TCVN 8271-3:2010 チュ・クオック・グーの文字集合で 242字を収録している。
TCVN 8271-4:2010 クメール語に対応した文字集合で 146字を収録している。
TCVN 8271-5:2010 チャム語 (* 22) に対応した文字集合で 83字を収録している。
TCVN 8271-6:2010 タイ語に対応した文字集合で 72字を収録している。

(図-10 チュ・ノムの一部)
チュ・ノムの一部
(図-11 チュ・クオック・グーの一部)
チュ・クオック・グーの一部
以上、駆け足で漢字文化圏の文字事情を見てきました。
ぬらくら子が知り得る可能な限り新しい情報をご紹介したつもりですが、文字集合規格はそれぞれの国・地域の事情でいつ改定されるかわかりません。

ここにご紹介した内容には日常的に接していない情報も多く、ぬらくら子の理解不足や誤解が含まれていないことを願っています。記述の間違いや、この記事の後に改定された規格の最新情報などがあったら、ぜひ、ご指摘ください。

それぞれの文字集合規格はそれぞれの国・地域の歴史・文化とは切っても切れないものです。Unicodeがあるとはいえ文字集合の策定や規格の改訂などは、その当事者が担ってこそ、育んできた文字文化を継承してゆくことができるのではないでしょうか。


* 1) 漢字文化圏の文字事情
『書物学21号』(勉誠出版 2022)初出。本稿は同誌に寄稿した「漢字文化圏の文字集合規格」を元に、それぞれの国・地域における文字に係る周辺事情や経緯などを追加し、再構成している。

* 2) 韓国での漢字使用
韓国では独立(1948年)するまでハングルと合わせて漢字も使われていた。独立後の漢字廃止政策施行とその後の漢字復活論争は今日まで続き、公教育における必修科目としての漢字教育については現在も結論が出ていない。

* 3) ベトナムでの漢字使用
1954年に公式に漢字の使用が廃止されている。

* 4) 漢字の形
漢字(文字)の形には「字体」と「字形」二つの概念がある。「字体」とは社会的に一定している文字の観念、形の基準を指す。「字形」とは字体を、手書き・印字・画面表示などによって実際に図形として表現したものを指す。この二つの概念は台湾と中国でも日本と同じように定義されている。

* 5) 旧字体
日本における当用漢字(1946年)制定以前に使用された漢字の字体。

* 6) 蘇州号碼(そしゅうごうま)
中国江南地方の蘇州で生まれたとされる数字。算木に由来する。

* 7) 注音符号(ちゅういんふごう、ちゅうおんふごう)
中国語の発音記号の一つ。現在は主に台湾で用いられる。先頭の四文字「ㄅㄆㄇㄈ」からボポモフォ (bopomofo) とも呼ばれる。

* 8) MS-DOS(エム・エス・ドス)
マイクロソフト社が開発・販売していた、パーソナルコンピュータ向けのオペレーティングシステム。Microsoft Disk Operating System の略。

* 9) 倚天中文系統(いてんちゅうぶんけいとう)
1980年代から 1990年代にかけて台湾の倚天(E-TEN)が販売していた IBM PC/XT および PC/AT 互換機用のプラットフォーム。マイクロソフトから Windows 95 がリリースされるまで、倚天中文系統は台湾のパーソナルコンピューター市場において圧倒的な市場シェアを持っていた。

* 10) ISO/IEC 10646:1993
符号化文字集合や文字符号化方式などを定めた文字コードの国際標準のひとつ。業界規格のUnicodeと概ね互換性がある。ISO/IEC 10646:1993 はその最初のバージョン。

* 11) ISO/IEC 2022:1994
国際標準化機構(ISO)によって標準化された文字コードの扱いについての規格。
七ビットあるいは八ビットの文字コードの符号化方式と、複数言語の文字を切り替えて表現する方式を定めている。

* 12) 簡化(かんか)
正字体とされてきた筆画の多い漢字(繁体字)の画数を減らして簡単な字体(簡体字)にすること。

* 13) Unicode(ユニコード)
文字集合(文字セット)の世界統一規格。1980年代に、Xerox が提唱し、Microsoft、Apple、IBM、Sun Microsystems、Hewlett Packard、ジャストシステムなどが参加するUnicode Consortium によって作られた規格。国際規格の ISO/IEC 10646 と Unicode 規格は同じ文字コード表になるように協調して策定されている。

* 14) CJK 統合漢字
Unicode が中国語、日本語、韓国語で使用される漢字を統合したもの。CJK はChina、Japan、Korea の頭文字をとったもの。CJK にベトナムの漢字(チュ・ノムを含む)を加えて CJKV ということもある。

* 15) 強制力のある文字規格
https://www.dynacw.co.jp/business/embedded_gb.aspx

* 16) ASCII(アスキー)
American Standard Code for Information Interchange(アメリカ情報交換用符合規格)の略。1963年に ASA (American Standards Association 米国規格協会)、後の ANSI(American National Standards Institute 米国標準協会)によって制定された。
アルファベットの大文字・小文字、数字、記号類、それに表示されることのない制御コードを割り当てた 128の文字集合。数字、アルファベットの大文字・小文字と記号類が 94文字、残りの 34 がスペースと削除を含む制御コードになっている。

* 17) イ(彝)
中国の少数民族の一つで、中国政府が公認する 56 の民族の中で七番目に人口が多い。雲南地方に最も多く居住している。

* 18)訓民正音(くんみんせいおん)
現在はハングルと呼ばれている朝鮮の文字体系のことを指す。世宗王によって公布された同名の書物を指す時にも使われる。字母の説明は全文、漢文で書かれている。
同書は次のような内容になっている。
 1) 世宗御製の序文
 何故このような文字を創ったのかを世宗自らが述べている序。
 2) 例義
 各字母の定義と文字の構成などを簡潔に解説している。
 3) 解例
 文字の成り立ちなどを解説し、実際の単語で用例を示している。
 書物としての訓民正音には他の版もあるので、この解例を含んだ訓民正音を訓民正音解例本と呼んでいる。
 4) 鄭麟趾の序文
 訓民正音の創製にあたった鄭麟趾の序文。世宗の序文と区別するために後序ともよばれる。

* 19) 頭脳集団ともいうべき八名とは以下。年齢は訓民正音が創られた一四四三年時点の年齢。
鄭麟趾(47歳)、崔恒(34歳)、朴彭年(26歳)、申叔舟(26歳)、
成三問(25歳)、姜希顔(26歳)、李塏(26歳)、李善老(年齢不詳)

* 20) ハングル・漢字併用の推移については、国立筑波技術大学総合デザイン学科・劉建国教授にご教授いただいた。

* 21) チュ・クオック・グー(Chữ quốc ngữ)
十七世紀にフランス人のイエズス会宣教師、アレクサンドル・ドゥ・ロードがベトナムでの布教の為に発明したベトナム語を表記するためのアルファベット。ベトナム語の声調(音の高低)を示す記号を付したラテンアルファベットで、現在ベトナム唯一の公用文字。

* 22) チャム語
ベトナム南部の山岳地帯とカンボジアのメコン川流域に住むチャム族の言語。


【参考文献】
安岡幸一・安岡素子『文字コードの世界』(東京電機大学出版局 1999)
Ken Lunde “CJKV Information Processing” (O'Reilly 1999)

全字庫網址:http://www.cns11643.gov.tw/

中文界面諮詢委員會網址:https://www.ccli.gov.hk/tc/

Office of the Government Chief Information Officer & Official Languages Division, Civil Service Bureau, The Government of the Hong Kong Special Administrative Region “Hong Kong Supplementary Character Set – 2016” (2017)

The Unicode Consortium:https://home.unicode.org/

中華民国教育部:https://www.edu.tw/Default.aspx

鈴乃栄主編・石汝傑著『現代漢語』甲斐勝二訳(鳳凰出版伝媒集団江蘇教育出版者 2008)

川幡 太一「中国の漢字符号化の歴史とGB 7589・GB 7590」『漢字データベースプロジェクト』http://kanji-database.sourceforge.net/papers/gb_history.pdf

中華人民共和国国家質量技術監督局『GB 18030-2000 信息技術 信息交換用漢字編碼字符集 基本集的拡充』(2000)

中華人民共和国国家質量監督検験検疫総局・中国国家標準化管理委員会『GB 18030-2005 信息技術 中文編碼字符集』(2005)

中華人民共和国国家市場監督管理総局・中国国家標準化管理委員会『GB 18030-2005 信息技術 中文編碼字符集(ドラフト)』(2022)

世宗『訓民正音』趙義成訳註(平凡社 2010)

野間秀樹『新版 ハングルの誕生 人間にとって文字とは何か』(平凡社 2021)

齋藤希史『漢字世界の地平』(新潮社 2014)

Viet Nam General Department for Standardization, Metrology and Quality Control (TCVN) “TCVN 5712:1993”(1993)

Viet Nam Ministry of Science and Technology “TCVN 8271-1:2009”(2009)

タイトルの「ぬらくら」ですが、「ぬらりくらり」続けていこうと思いつけました。
ぬらくらは、ダイナフォント News Letter(ダイナコムウェア メールマガジン)にて連載中です。
いち早く最新コラムを読みたい方は、メールマガジン登録(Web会員登録)をお願いいたします。
メルマガ登録はこちら
 
ダイナコムウェア コンサルタント
ダイナコムウェア株式会社
コンサルタント
mk88氏

PROFILE●1942年東京都生まれ。1966年桑沢デザイン研究所ビジュアルデザイン科卒。設備機器メーカー、新聞社、広告会社を経て、総合印刷会社にてDTP黎明期の多言語処理・印刷ワークフローの構築に参加。1998年よりダイナコムウェア株式会社に勤務。Web印刷サービス・デジタルドキュメント管理ツール・電子書籍用フォント開発・フォントライセンスの営業・中国文字コード規格GB18030の国内普及窓口等を歴任。現在はコンサルタントとして辣腕を振るう。
Blog:mk88の独り言

月刊連載ぬらくらバックナンバー
連載にあたっておよび記事一覧
ぬらくら第130回はこちら
ぬらくら第131回はこちら
ぬらくら第132回はこちら
ぬらくら第133回はこちら
ぬらくら第134回はこちら
ぬらくら第135回はこちら
ぬらくら第136回はこちら
ぬらくら第137回はこちら
ぬらくら第138回はこちら
ぬらくら第139回はこちら
ぬらくら第140回はこちら
ぬらくら第141回はこちら
ぬらくら第142回はこちら
ぬらくら第143回はこちら