連載コラム
2015年12月25日

ぬらくら 第60回 全角と半角

ダイナコムウェア東京本社がある神田神保町は全国に知られた古書店街、 スポーツ用品店がふえたとは言え、まだまだ古書祭りが開催されるほどには古書店が軒を連ねています。
そして、今年も盛況裡に終わった「神田古本まつり」でした。
今年は、歩道に設けられたワゴンの古書に手を伸ばす人達の中に、直ぐにそれと分かる外国からの旅行者の姿が少なからず見受けられました。

汗ばむような陽射しの一日、昼食後に冷やかし半分の気まぐれで古書を あさる人達に紛れてぬらくら子も古本まつりを巡ってみました。
何気なく手にした古い単行本の、茶色に変色したページを軽くなぞると、 指先が紙の感触とは別の小さなモコモコした凹凸を捕らえます。
このモコモコは紙に文字を刷るときにできる凹凸で、この単行本が凸版で印刷された証です。

凸版印刷とは、印鑑のようにインクの付く文字や図が裏返しの凸状になっている 版で印刷する印刷方法のことです。文字の部分には活字(*1)が使われました。

ぬらくら子がグラフィック・デザイナー駆け出しの頃、活字は未だ現役でした。

明朝9ポ 縦ベタ32字 X 16行 行間9ポ二分四分

などと本文原稿に指定したものです。
上の指定は『9ポイントの明朝体で縦に、一行を32字詰めで、文字と文字の間は開けずに組む。一ページは16行で、行と行の間は9ポイントの二分四分開きにする』 となります。

活字一本分の幅(高さ)を全角、その半分(1/2)を二分(ニブ)、1/4を四分(シブ)、 3/4を二分四分(二分と四分を足した大きさなのでニブシブ)と呼んでいました。
これらの大きさは元になる活字の大きさに依存するので、もちろん絶対値では ありません。「二分」を「半角」と呼ぶことはありませんでした。 話はコンピューターで文字を扱う時代に跳びます。

コンピューターで情報を交換する際に用いる文字集合として、7ビットのASCII (American Standard Code for Information Interchange/アメリカ情報交換用符合規格) を8ビットに拡張したJIS C 6220「情報交換用符号」(*2)が1969年に制定されました (1976年にJIS X 0201に改定されています)。
これはASCIIの文字集合をベースに英字52文字、数字10文字、記号40文字、 カタカナ55文字の合計157文字のそれぞれを1バイトで表現(エンコーディング) した文字集合です。
このときに追加したカタカナといくつかの記号の形は、英数字に合わせて 欧文タイプライターの文字のように、全ての文字幅が同じで正方形を縦に 二分したマスに収まるように作られました。

その後、コンピューターで漢字やひらがな・カタカナを含む情報を交換するための 文字集合として1978年にJIS C 6226「情報交換用漢字符号系」(*2)が制定されます (1983年にJIS X 0208に改定されています)。この規格が日本で最初の日本語文字集合規格になります。
この規格は、使用頻度の高い漢字を集めた第一水準と使用頻度の低い漢字を集めた 第二水準の漢字、ひらがな・カタカナ・アルファベット・数字・記号類などを含む 6,802文字のそれぞれを正方形のマスに収め、2バイトで表現した文字集合です。この2バイトで表現した文字集合にもアルファベットと数字が含まれていることに留意してください。

私たちがパソコンで利用している日本語のTrueTypeフォントやOpenTypeフォントには、 JIS X 0201(JIS C 6220)が規定している1バイトの文字と、JIS X 0208(JIS C 6226) が規定している2バイトの文字が含まれています。

つまりアルファベットと数字、記号類の一部には1バイトと2バイトの2種類があり、 それぞれに文字をコンピューターで利用するための全く別の番号がふられています。
例えばアルファベットの“a”はJIS X 0201では 0x0061が、JIS X 0208では0x2361が 割り振られています。
数字の“9”にはそれぞれ0x0039と0x2339が、と言う具合です。
この番号の最初の0xは続く四桁の数値が十六進数(*3)であることを現しています。

簡単な表にすると次のようになります。

例字 文字にふられた番号
JIS X 0201 JIS X 0208
a 0x0061 0x2361
9 0x0039 0x2339

組み版にコンピューターが利用されるようになり、DTP(Desk Top Publishing)が 普及するに伴って、何時の頃からか明確な時期は定かではありませんが、 JIS X 0208の文字が正方形のマスに収まるように作られていることから「全角文字」、 JIS X 0201のアルファベット・数字が正方形を縦に二分したマスに収まるように作られていることから「半角文字」と呼ぶようになりました。

コンピューターで扱う文字集合の規格とは別に組み版に関するJISが制定されています。1993年に制定されたJIS X 4051「日本語文書の組版方法」です。
この規格では、全角を「漢字1文字分の外枠」、半角を「字幅が、全角の1/2である 文字の外枠」と定義しています。
全角を「2バイトで表現した文字」、半角を「1バイトで表現した文字」とは言っていません。

全角、半角を整理してみましょう。

■全角文字
1.2バイトで表現される文字
2.ASCIIおよびJIS X 0201以外の文字
3.表示上の字形の縦横が1対1の文字

■半角文字
1.1バイトで表現される文字
2.ASCIIおよびJIS X 0201の文字
3.表示上の字形の幅が全角文字の半分である文字

2バイトの文字だから全角文字、1バイトの文字だから半角文字というのは不正確です。
繰り返しになりますが、全角文字とは縦横1:1のマスの中に作られている文字、 半角文字は縦横1:1/2のマスの中に作られている文字と言うことです。
文字の幅が全角か半角かということと、文字につけられている番号が2バイトなのか 1バイトなのかと言うこととは本来は無関係です。

弊社の和文フォントの中には2バイト文字の幅が半角に近いデザインの 「DF金文体まつW3」や「DF古籍真竹AW3」のようなフォントがあります。極端な例として「DFてがき童W1」のように文字の縦・横とも全角の半分以下 というフォントもあります。

文字の世界も時代と共に変化しています。

*1 文字の部分は活字
本来は活字を組んで版をつくり、この版に直接インクをつけて印刷したものを、特に活版印刷ということもある。その後、鉛版・電鋳版・樹脂凸版などと呼ばれる 複製版が利用されるようになり、活版印刷とは分けて凸版印刷というようになる。

*2 JIS C 6220「情報交換用符号」/JIS C 6226「情報交換用漢字符号系」
2012年3月30日発行の「ダイナフォント News Letter(Vol.18)ぬらくらコーナー 『符号化文字集合』」を参照。記事はこちら

*3 十六進数
2012年10月26日発行の「ダイナフォント News Letter(Vol.24)ぬらくらコーナー 『二進数・八進数・十六進数』」を参照。記事はこちら
タイトルの「ぬらくら」ですが、「ぬらりくらり」続けていこうと思いつけました。
ぬらくらは、ダイナフォント News Letter(ダイナコムウェア メールマガジン)にて連載中です。
いち早く最新コラムを読みたい方は、メールマガジン登録(Web会員登録)をお願いいたします。
メルマガ登録はこちら

  著者 Information

著者
ダイナコムウェア コンサルタント
mk88氏

PROFILE●1942年東京都生まれ。
1966年桑沢デザイン研究所ビジュアルデザイン科卒。
設備機器メーカー、新聞社、広告会社を経て、
総合印刷会社にてDTP黎明期の多言語処理・印刷ワークフローの構築に参加。
1998年よりダイナコムウェア株式会社に勤務。
Web印刷サービス・デジタルドキュメント管理ツール・電子書籍用フォント開発・
フォントライセンスの営業・中国文字コード規格GB18030の国内普及窓口等を歴任。
現在はコンサルタントとして辣腕を振るう。
Blog:mk88の独り言

次 : ぬらくら 第62回 じゃじゃ麺   
前 : ぬらくら 第60回 全角と半角