今年は変体仮名の符号化が……

10月末に更新したっきりなので、そろそろ何か書こうと思いつつ面倒で……。
ネタを思いついてもTwitterに断片的にアップして事足れりとなってしまう。

変体仮名の符号化に若干進展があったことも、書いておこうと思いつつそのままになっているが、今月中に国内でのレパートリー取りまとめと符号化方法の議論を行い、9月にはISO/IEC 10646への追加提案をする予定だそうだ。

そこまで進んだところで水を指すのもなんだが、ホントに変体仮名を符号化していいものなのだろうか、と思い悩むわけで、そのへんのことを書いておく。

まずはTwitterに投げた画像ふたつ。

f:id:koikekaisho:20150114161124p:plain      f:id:koikekaisho:20150114161133p:plain


智永の『真草千字文』から草書の漢字をいくつか拾っただけのもの。
「知婦也女為」はひらがなの「ちふやめゐ」そっくり。
「阿以可登者婦之乃夜耳」は変体仮名の「あいかとはふしのやに」と変わらない。
もちろん仮名が成立する以前に中国で書かれた文字である。

●「仮名(かな)」は日本語を書き表すために日本で生まれた文字である。
●「仮名」とは漢字を用いて日本語を書き表す用法であり、文字そのものは漢字である。

矛盾するようだが、どちらも正しい。歴史的に二つの側面を仮名は持っている。
それを踏まえて「変体仮名の符号化」を考える。

現代の視点では「変体仮名は平仮名の異体」であるから、平仮名に異体字選択符号を付けることで符号化すればよいと言える。IVSならぬKVS。「あ」は「あvs00」で、「阿」が「あvs01」などとすればいい。vsに対応しないフォントでは自動的に平仮名に戻ってくれる。
ところが、この方式だと上に挙げた「夜」とか、下の「等」のような場合に厄介なことになる。

f:id:koikekaisho:20150114161217p:plain

「夜」は「や」「よ」の両方の変体仮名、「等」も「と」「ら」の両方の変体仮名として用いられるので、自動的にどちらかに戻されては間違いになってしまう。

では、歴史的視点に立って、「変体仮名は元となった漢字の異体字」と考えてはどうか。
例えば、「阿」は「阿kvs00」とか、「以」は「以kvs01」(「以kvs00」=「い」)とするわけだ。
書作品を活字に起こす際には変体仮名は漢字で表すのが通例だから、kvsに対応しないフォントでは自動的に漢字に戻ってくれるのも悪くない。
ところが、これにも問題があって、元になった漢字が何かという点で異説のある仮名が存在することだ。
「つ」は「川」だが、「門」「⾾」説もあるし、「て」の変体仮名に「天」と「弖」の二説あったりする。

それならやはりvsはあきらめて、普通の符号位置を与えたらどうか、U+1B002からU+1B0FFで254個、U+1C000からU+1C0FFで256個の「空き領域」がある。現状のレパートリーは287字なので十分なスペースが空いている。
ただ、どう見ても「草書体の漢字」にしか見えない「変体仮名」にこれだけの独立した符号位置をくれというのは、なかなか度胸(というか厚かましさ)がいる。おまけにU+1B001(や行のye)とそっくりの「あ行のeの変体仮名」も入れることになる……。

どうするのかなぁ。