はじめに
昨日のエントリー「塗り下駄配列の提案」*1では、拗音シフトについては触れませんでした。今日は下駄配列の拗音シフトを検討します。
今回はkouyさんが「ローマ字入力でもなく、かな入力でもなく : 100万字日本語かなn-gramデータ」*2にて公開しているデータを参照しました。
「くぉ」、「つぁ」や「つぃ」の出現頻度の検討
kouyさんが分析した2-gramのデータによれば、「くぉ」は11回、「つぁ」は6回、「つぃ」は4回出現しています。「下駄配列って何だ?」*3にある拗音シフトの説明図で灰色の背景色のキーのうち、出現頻度上位三つがこれです。これぐらい出現頻度が低いのであれば、これらの代わりに、他の文字列を置くほうがよいでしょう。そうは思うのですが、拗音シフトに手をつけ始めると下駄配列からだんだんと遠ざかってしまうと考えました。必要な限りにおいて「拗音」のシフトを改変することにしましょうか。
拗音シフトの機能に組み込む文字
2-gram の解析結果を眺めれば、塗り下駄配列において同じ指で違うキーを押すものとして、以下の五つが浮かびあがってくることでしょう。
- それ
- など
- にし
- あり
- っく
これらを拗音シフトの機能に組み込むこととします。
なお、3-gram以上の解析結果と併せて考えれば、最後の「っく」とは「クリック」という語句の存在が大きく影響していることがわかります。
拗音シフトへ文字を組み込む位置
下駄配列の拗音シフトの規則性を崩して、上記の五つを拗音シフトに盛り込むとすれば、次のように設定するのがよいでしょう。
- くぁ(拗音シフト1)→それ
- くぇ(拗音シフト1)→など
- ぴぇ(拗音シフト2)→にし
- つぁ(拗音シフト2)→あり
- つぃ(拗音シフト2)→っく
前後に出現する文字を考慮しています。同じ指で違うキーを押すことは、「などは」をのぞいて、少ないと思います。
おわりに
これ以上下駄配列の拗音シフトを書き換えると、「50音図によってカナを記憶している現代の一般日本人にとっては不快極まりない、いわゆるノイローゼ・キーボード」*4と言われそうですので、ここでやめておきます。
補遺
最新の設定では、拗音シフト2をさらに書き換えています。その最新の設定は、d:id:blechmusik2:20090330#1238358974に掲載しています。