甲骨文字が無料でダウンロード!「白川フォント」
明朝体、ゴシック体をはじめPCで表示できる文字にはさまざまな字形があるが、2016年12月、ここに新しく甲骨・金文などの古代文字が加わった。公開から1年足らずでダウンロード数9500件を超えた(2017年9月現在)話題のフォント開発に携わった前田亮先生が、コンピュータによる文字と言語情報の処理を語る。
「白川フォント」があれば、あの甲骨文字
“フォント”とは、いわば“同書体の文字の詰め合わせ”である。「白川フォント」と呼ばれるこのフォントは、漢字の字源研究で知られる故・白川静博士が自著に収めた古代文字を、フォント化したもの。「白川フォント」には、常用漢字(2136字)、人名漢字(650字)の中で古代文字が判明している4391字もの漢字が収められている。開発したのは、白川静記念東洋文字文化研究所(白川研)と、前田先生が所属する立命館大学情報理工学部ディジタル図書館研究室で結成されたプロジェクトチームだ。
漢字の発展を願って開発された「白川フォント」のポイントは、これまでPC上での利用が難しかった古代文字をごく簡単に扱えるようにした点にある。白川研のWebサイトなどから無料でダウンロードできる上、現代漢字を入力するだけで対応する古代文字を表示できるという手軽さから、実際、福井県の小学校では漢字教育に導入されている例もあるという。また、「白川フォント」は文字の輪郭を数学関数で表現する“アウトライン形式”なので、どんなに拡大・縮小しても文字が崩れない。大判のポスターなど、活用の場はますます広がりそうだ。
しかし「白川フォント」最大の特徴は、これまで表示できなかった古代文字に、現代の漢字と同じ“文字コード”が割り当てられていることである。この、“文字コード”とは何なのか。
“文字コード”の標準化がITを推し進めた
“文字コード”とは、文字を“コード(符号)”で表わしたもの。つまり、文字ごとに割り当てられた固有の番号のことだ。
文字を数字に置き換えて表わす行為自体は、古代から行われていた。古代ギリシアの歴史家・ポリュビオスが考案した暗号表などが有名だそうで、日本では、上杉謙信の軍師・宇佐美定行が記した兵法書『武経要略』に記された上杉暗号などが知られるという。
“文字コード”という言葉が初めて登場するのは19世紀のこと。急速な電気通信の発展により定められた、「ボーコード(Baudot code)」という国際テレックス網の標準文字コードがそれである。大型の「汎用コンピュータ」が発明されたのは1940年代。1950年代にはコンピュータの世界でも“文字コード”が利用されるようになるが、当時はコンピュータだけでなく電気通信のコードも乱立し、混乱を招いていた。そこで、互換性を持たせるべく「アメリカ規格協会(ASA)」が文字コードの標準化に着手した結果生まれたものが、現在に至るまでコンピュータ文字コードの基盤となっている「アスキー(ASCII)」と呼ばれるコード。何度かの改訂を経て「ASCII」がほぼ完成に至ったのは、1967年のことである。
以降、コンピュータによる文字情報の処理は、めざましい発展を見せる。「ASCII」を基にさまざまな種類の文字コードが生まれ、ヨーロッパ言語のアクセント付き文字、漢字、ハングル、サンスクリットなども容易に扱えるようになった。そればかりか、既存の文字集合の規格をすべて収録した「ユニコード(Unicode)」においては、いまやスマホですっかりお馴染みの“絵文字”までもが収められている。
コンピュータを駆使した情報学が次に向かう先は?
このように長足の進歩を遂げたコンピュータの言語処理であるが、今後はどのように発展していくのであろうか。前田先生は、人文系の研究で扱われる情報のディジタル化が進んできていることを背景に「これからは人文学にコンピュータをどう使うか」がポイントになってくると話された。
たとえば、古典史料のディジタル化。従来画像での保存が一般的であったが、これを電子テキスト化することによって、人物表現を自動抽出するなど統計的な分析が可能になるという。結果、当時の人間関係の可視化などに役立つとのことだ。ディジタルヒューマニティーズ(ディジタル人文学)と呼ばれるこの研究には、人文学、情報学、図書館学、博物館学などさまざまな分野の研究者が関わっている。
先生は言う。
「過去の叡智を再考して未来に生かす、一助となるのではないでしょうか」。
〔今日の名言〕 「白川フォント」は作業手順を定型化し、1文字約8分で制作しました
◆取材講座:「コンピュータによる文字処理の歴史と展望」(立命館土曜講座)
文・写真/木村やよい
初出:まなナビ