なお、数学者というのは完全な証明を求める人種であることを描写するために本書で引用されている小話を紹介しておく。
「天文学者と物理学者と数学者がスコットランドを旅行していたとき、列車の窓から原っぱに一頭の黒い羊がいるのがみえた。
(天文学者):これはおもしろい。スコットランドの羊は黒いのだな。
(物理学者):何をいっているんだ。スコットランドの羊の中には黒いものもいるということじゃないか。
(数学者) :スコットランドには少なくとも一つの原っぱが存在し、その原っぱには少なくとも一頭の羊が含まれ、その羊の少なくとも一方の面は黒いということさ。」
文字コード問題とは、(ものすごく乱暴にいえば)「各言語の個々の文字とコンピュータ上で扱う符号との対照表をどのように作るか」という問題。例えば、もし、私のパソコンは「東」という文字を0001と符号化する対照表を使用し、私の通信相手のパソコンは0001という符号と「西」を対応させる対照表を使用していたとすると、私は待ち合わせ場所を「新宿駅東口」と書いて送ったつもりなのに相手方のパソコンには「新宿駅西口」と表示されることになる。我々が日常的に使用する文字の範囲では、一定の規格がすでに成立しているので、このような極端なことは起こらないが、それでも複数の規格が併存してるためときとして文字化けが生じる原因になっている。
本書の記述の中心は、漢字のコード化である。文字種類が極端に多く、一つの文字について歴史的に様々な書体があり、かつ日、中、韓の各国間でもばらつきがある漢字をどのようにコード化するか。これは、日本国内における現在のJISコードをどのように拡張していくかという問題であると同時に、世界中の文字を共通のコードで符合化しようとする国際的な取組の中で漢字をどのように位置づけるかという問題でもある。
本書では、この他にも日本の漢字制限論を巡る動向が文字コードにどのように影響を与えてきたかといった歴史的事実の掘り起こしから、マスコミでも話題になっている「今昔文字鏡」、「e漢字」、「超漢字」といった漢字をめぐるプロジェクトの紹介・評価に至るまで幅広く触れられている。
また、真の多言語環境の構築には、英語を中心とする西欧諸国の言語と漢字だけでなく、アラビア語やインド系の言語等に対する十分な認識が必要との指摘にもうなずかされるものがある。
本書の記述はよく整理されているが、問題の性質上、内容がある程度煩瑣になる面がでてくるのはやむを得ない。何種もの文字コード規格が紹介されるので、最初のうちはメモをしながら読んだ方がよいかもしれない。ただ、多少細かい点をとばしても、とにかく全体を読み通すことにより得られる知見は大きいだろう。
なお、冒頭に紹介した著者のウェブサイトには、本書のサポートページをはじめ、文字コード問題に関する興味深い内容が満載されている。リンク集も非常に充実している。是非訪問することをお奨めしたい。