変体仮名符号化の是非を考えるメモ

年の終りに考えを整理しておく。

変体仮名を機械可読な符号として標準化することについて、私的な結論を出しておこうということだ。

現在用いられている仮名と同じ音を表しながら形状が異なる仮名。かつては（明治まで）用いられていたものである。

明治初期には鋳造活字も作られ、印刷・出版に用いられていたが、20世紀になると教科書での使用が制限されると同時に印刷工程の合理化の要請もあって（原稿では使用されていても）出版物からは姿を消した。

現在見ることができるのは、書道作品、商家の看板、昭和初期までに生まれた人の名前などでしかない。これらに用いられている場合も、一般には通常の仮名もしくは漢字に置き換えて表記される。

従って、現代日本語の表記のためには変体仮名は全く不要であるから、JISは標準化を見送っているし、それで問題ない。

しかし、Unicodeとなると話が変わってくる。Unicodeは、より広範に「全ての文字」を符号化することを目的にしているように見受けられるからだ（エジプトのヒエログリフや漢字拡張など）。このレベルの文字まで収録するなら、（前述のように現代の用例がある）変体仮名を収録することに矛盾はない。

実際のところ、Unicodeにはすでに仮名文字増補として符合位置が用意されている。そこに置くべきレパートリーの提案も出ている。ただしその提案は日本のナショナルボディの支持を得られず、たなざらしになっているのだ。

ただ、別の提案によって、カタカナのエに対する「?」とひらがなのえに対する「?」の二つだけが符号化されている。残りは254字分。これで収めなければ駄目というわけではないが、一つの目安というところだ。

JIS X 0213に変体仮名を入れてはどうかとF氏が言っていた時は、200字程度を想定していた。

変体仮名の分類

一口に変体仮名と言っても、幾つかの分類が可能である。

一つは、通常の仮名（いろは仮名と呼ぶ）とは元になった漢字（字母）が異なるもの。たとえば、記紀万葉の用字を最大集合とし、平安から江戸期までの仮名をその字母に従って整理して分類するというもの。

二つ目に、字母が同じで崩し方の違いで形状が異なるもの（いろは仮名に対するものと、別字母の内でのものがある）。現代の文字フォントのいろは仮名のデザインの振れ幅に収まってしまうものもあり、判定には論議を呼びやすいと思われる。

三つ目に、平仮名か草仮名かの違い。この区別は専門家の目を必要とする。草書の漢字仮名交じりで書かれたものの中から仮名を抽出することは簡単ではない。一般に仮名文学、仮名書道といわれるものでも、日本語を書いている限り少ないながら漢字を交えている。草書の漢字から仮名に至る中間の段階のものが、かな字典の類にはかなり現れる。

四つ目の分類法は、明治初期に鋳造活字になっているか否かである。現代とは違い、日常的に多くの仮名を読み書きしていた時代の目による取捨選択には一定の信頼を置いてよいのではないかという考えだ。

五つ目に、住基文字との対応がある。住基文字に規定された168の変体仮名は、あくまで人名に使用されたであろう文字でしかないが、公的規格である点で無視できない。ただ、例示字形が下手すぎるのが難点である。

f:id:koikekaisho:20121231090521p:plain

標準化の前提（符号化否定論）

京都・中西印刷の先代が「新聞に印刷された」世界の文字を収集されていて、文字符号化・標準化という点で卓見であると感じたものだ。手書きの個々の文字から符号化を行うのは現実的ではない。何らかの（基本は鋳造活字）複製技術によって一度標準化された文字のみを符号化するのでなければ、「文字とは何か」という定義すら危うい。

そういう点で、古漢字の符号化が挫折したのは当然の帰結だろう。

変体仮名の符号化においても、似たような問題がある。

いろは仮名という標準化からこぼれた仮名であるがゆえに、変体仮名のレパートリーを確定するような研究はほとんど行われていない。符号化のために、これを調査するというのは本末顚倒と言わざるを得ない。

JIS漢字が「高」と「髙」を包摂していることで、包摂という当たり前の行為（多様な字形を文字として解読するために同一視する認識行為）そのものが何か独善的な判断のように誤解されてしまったことがあるが、JIS漢字を否定したうえで対案として提示されたどの符号化方式でも、結局のところ符合位置に適合する実字形の包摂なしには成り立たない。

埼玉県さいたま市の「さ」が教科書体のそれではなく明朝体のそれであるというような物言いによく現れているように、また葛飾区の「葛」と葛城市の「葛」を別符合とすべきだという主張が存在するように、現代日本では文字包摂の範囲を狭める方向に進んでいるかに見える。日本ばかりでなく、Unicodeの漢字拡張の方向も無用な異体字の増加をしめしている。

仮名がいろは仮名に標準化されて100年を越した今、あたかも絶滅した朱鷺を復活させて保護するかのような変体仮名の符号化にどれほどの意義があるのだろうか。

失なわれた文化の記録（符号化肯定論？）

記紀万葉の表記（万葉仮名）は、古代の音韻を研究する上で大きな役割を果たした。

一方、平仮名はその使用実態から、平安後期には過去の音韻が失なわれたことを示す役割を担った他は日本語研究に資するところは少ない。仮名遣いの変化はあったが、それらはすべていろは仮名で書き表すことができ、変体仮名を必要としない。

にもかかわらず、明治初期までそれら多様な仮名が使われ続けた事実がある。なぜ我々の祖先は高々70の音を書き表すのに300もの仮名を使い続けたのか。

黄表紙の稿本で「れ（礼）」と書かれているのに、刊本の筆耕が「（連）」としたのはなぜなのか。個人の書き癖なのか、何らかの必要性があったのか、黄表紙本に共通する美意識が存在したのか。

表記の規範や伝統、様式というものを考える上で、このような仮名字形の使い分けを仔細に検討することは無駄ではなかろう。

ただ、その研究が結論を見るまで変体仮名の符号化はできないとも言える。同一文書での字形の使い分けと他の文書との擦り合わせによって、さらに時代の異なる文書との比較を通じて、代表字形とその包摂範囲を定めない限り符号化はできない。研究には符号化文字を用いた統計的なアプローチ以前に原本画像の切り出しによる標本の集積のほうが適切であろう。漢字字体の揺れの研究にHNGが有効であるのと同じように。

一方で、江戸期までの漢字仮名交じりの文書を電子化する際に、仮名をすべていろは仮名で入力するなら、詳細なマークアップが必要となる。暫定的に変体仮名の符号化を行い、それを用いて電子化を行えば、若干の省力化は可能だろう。将来の改訂・拡張を前提として包摂範囲を広めにとった符号化を行うことは無駄ではないかもしれない。

つまりは……

足りない頭をひねってみても、変体仮名の符号化を推進する根拠はやはり薄弱だという結論に達してしまう。

たとえば初出からいろは仮名で印刷され、著者自身もそれで満足していた小説を「原稿通り」に変体仮名を用いて電子化することに意味があるかといえば否定的にならざるを得ないし、古典の原本通りの復刻を符号化文字で行うとしても、字の姿は画像によるほうがより正確である。

変体仮名を知らない若い世代に教養として伝えるにしても、そのような仮名を手書きしたことのないデザイナーが作る変体仮名フォントが、正確にその筆法を伝えられるかどうかという疑問もある（住基仮名が失敗例としてすでに存在する）。

一つだけ、Unicodeに変体仮名を収録したいと思えるのは、明治期の活字変体仮名を復刻して、それをいろは仮名の異体字でなく固有の符号位置を持ったグリフとして使えることくらいなのである。

新年からぼちぼち、一字ずつ見ていこうと思っている。

まずは皆様よいお年をお迎えください