たまりば

  パソコン・インターネット パソコン・インターネット  三鷹市 三鷹市

KanSix5
2010年09月17日 16:08

KanSix5

久しぶりにKanSixを増強しました。
[KanSix5.zip]
前回あたりからただ頻度順に増やしていくのに飽きてきているので、気晴らしに他の文字も結構描いてます。

今回追加した漢字は、
まずWikipedia上位の続きがこちら。
望臣推植房彦習沿筆裁養邦岸弟秒採求密材韓仁況功仏並圧沖礼精砲講延囲盟識札幕徴票負席康扱策季湾徒布爆刑輪貨故伴具恋枚替忠景仮舎惑療談働絶輸仙険宙許弘熱敵液貴適乱則恵潟描

そして、漢字を分解して書くときに役立ちそうな文字をかなり追加しました。
占昔勿亜宛易亥充因丑曳炎凹灰卯閏且刈丘求巨凶句串兄刑圭午互吾乞此才冊勺尺尽昼舎甫弱朱肖丈刃壬束旦兆凸廿巴包亡朋凡尤旨也乂于亢从坐侖卆卉夬夭它朿甬珀劦丂业丩丰邦壮兑兌关尚呂冬奴夆夗鬱欝乍弥氿刑只双亘印
これらの字の選定には、CHISEという漢字構造情報データベースを利用しました。
CHISEでJIS第一水準の字を調べ、その中でよく使われていそうな部品や描きやすそうな部品を、適当に気が向いたものから描きました。

他にもこれらの基準から外れて描いた漢字があった気もしますが、よく覚えていません。
あ、そうそう、今回ついに頻度順に描いていって描けない字がでてきました。「援」です。
いいドットパターンを思いついた方がいらっしゃいましたら、著作権放棄していいなら教えてください。
(まあ小サイズのビットマップフォントには著作権は無いって判断もあるけど…)

また、前回追加した康煕字典214部首についてですが、実はUnicodeには普通の漢字としての部首文字とは別に「部首ゾーン」が用意されています。
前回描いたのは普通の文字だったのですが、今回部首ゾーンの方も描いておきました。

漢字以外にも色々描いてます。
まずJIS2004の非漢字部の内、発音記号と「㍉」などの組み文字を除いた部分を描きました。
それと、コード表を見渡していて目についた文字、というか記号をいくつか。目立ったところでいうと通貨記号ゾーンを全部埋めてみました。
₠₡₢₣₤₥₦₧₨₩₪₫€₭₮₯₰₱₲₳₴₵₶₷₸
今度Unicode6.0に入る予定のインドルピー記号もこっそり入れちゃいました。「₹」

あと、今回大きな変更点として、半角数字の幅を広くしました。
数字は一番最初に描いたのでなんとなく半角なら横6ドットの半分で3ドットだろうと描いたのですが、その後アルファベット系を描いていくうちに半角は基本4ドットになっていってたので、今さらですがそれに合わせました。

ところで、このフォントを作るのにはFontForgeというソフトを使っているのですが、これがたまにランダムにごく一部の文字を破壊します。気づく限り直しますが、文字が増えてきてそれもままならなくなってきました。変な文字があったら教えてください。
なお、破壊された文字は大抵、ほとんど白い中に黒いドットが数ドットだけある状態になりますので、壊れたかどうか分からないような壊れ方はしません。今の所。
また、UnicodeのBMP(基本多言語面)外の文字が保存時に消える現象も出ているので、FFA1辺り(半角ハングルの領域)に避難させてあります。この領域は無視してください。まあもともとまず使わないような場所ですが。

最後に文字数について。
今までは描いた文字の記録を取っていてそこから数えていたのですが、ランダムに描くようになって記録が面倒になったので、前回から機械的にカウントすることにしました。
具体的には、FontForgeの機能でフォント中に存在するグリフのコードを出力させ、そこから漢字に相当する文字数をカウントしています。
手作業でのカウントとは重複して描いた文字の扱いなどが異なっているかもしれませんが、元々そんなに厳密なものではないと諦めてください。
というわけで今回の文字数を発表しますと、
全文字数 : 2880文字
うち漢字数 : 1148文字
です。ついに1000文字の大台に乗りました。
この文章を書いていても、使えない文字は滅多に出てきません。今回色を付けてみたので確かめてみてください。
まだまだ文字は増やせそうな雰囲気なので、これからも暇なときに適当に増やしていこうと思います。

※当日夜追記
zipに文字表を追加しました。

-----
2010.12/18追記
次→KanSix6