たまりば

  パソコン・インターネット パソコン・インターネット  三鷹市 三鷹市

Lucida Grandeとريال‎
2008年05月28日 04:23

今日知ったのだが、Firefoxで全角コロンおよび全角数字が文字化けする現象があるらしい。
某サイトで文字化けの様子を写した画像があったので勝手に転載する。(著作権はないだろう)
文字化けアラビア文字
これを見ると特に下3つに出てくる奇妙な形の文字が目を引く。全角コロンが化けるとこれになるようだ。

これはアラビア文字として読むことができる。「ريال」という4文字が合字になったもののようだ。分解すれば右から順に‎ر‎+ي‎+ا‎+ل‎、英字に翻字すればR・Y・A・Lである。
色々調べてみるとこのريالというのはリアルと読み、中東諸国で使われている通貨単位らしい。なるほど、合字が作られるのもうなずける。
この合字はUnicodeのFDFCにある。
一応載せておくがマイナーな字なので表示されないかもしれない。


さてこれが全角コロンに化ける原因はというと、どうやら「Lucida Grande」というフォントが元凶らしい。
自分の環境には入っていないフォントなのでフォントが悪いのかFirefoxが悪いのかはよく分からない。

ちなみに全角コロンの文字コードはFF1A。どこをどう間違ったらFDFCになるのか謎である。

ただ、全角コロン(と全角数字)もこのリアル記号もUnicodeの「互換文字」に分類されるという共通点はある。
この互換文字というのは、過去の文字コードとの互換性を保つためにある文字で、基本的には使用は推奨されていない。
例えばこのリアル記号のように他の文字の組み合わせ(‎ر‎+ي‎+ا‎+ل‎)で表せる文字や、全角コロンのように実質的に同じ文字(半角:)が存在するものがこの互換文字に分類される。
ソフトによってはこの互換文字があるとそれと同等な通常の文字に"分解"して表示するものがあるのだが、それの誤作動なのかもしれない。

なおこの"分解"というのはUnicode用語で日常用語とは多少意味が違うので注意。
1文字が複数文字に分解される場合だけでなく1文字が別の1文字に変換されるのもこの"分解"に当たる。

余談だが、「互換文字」というネーミングはどうも気に食わない。
元々の英語では「compatibility character」と呼び、「compatibility(互換性)のための文字」というニュアンスが出ている。
だが、これを日本語にする時に「性」を取ってしまったために、ただ単に「互換な文字」というイメージになってしまい、意味が取りづらくなってしまっている。
まあ互換性文字というのもいまいちしっくりこないので誤訳とまでは言わないが。


  • Post time : 2008年05月28日 04:23│Comments(0)
    URL欄を実験的に消してる間に廃止されてしまいました。まあいいか。
     
    <ご注意>
    書き込まれた内容は公開され、ブログの持ち主だけが削除できます。
    削除
    Lucida Grandeとريال‎
      コメント(0)