たまりば

  パソコン・インターネット パソコン・インターネット  三鷹市 三鷹市

Lucida Grandeとريال‎
2008年05月28日 04:23

今日知ったのだが、Firefoxで全角コロンおよび全角数字が文字化けする現象があるらしい。
某サイトで文字化けの様子を写した画像があったので勝手に転載する。(著作権はないだろう)
文字化けアラビア文字
これを見ると特に下3つに出てくる奇妙な形の文字が目を引く。全角コロンが化けるとこれになるようだ。

これはアラビア文字として読むことができる。「ريال」という4文字が合字になったもののようだ。分解すれば右から順に‎ر‎+ي‎+ا‎+ل‎、英字に翻字すればR・Y・A・Lである。
色々調べてみるとこのريالというのはリアルと読み、中東諸国で使われている通貨単位らしい。なるほど、合字が作られるのもうなずける。
この合字はUnicodeのFDFCにある。
一応載せておくがマイナーな字なので表示されないかもしれない。


さてこれが全角コロンに化ける原因はというと、どうやら「Lucida Grande」というフォントが元凶らしい。
自分の環境には入っていないフォントなのでフォントが悪いのかFirefoxが悪いのかはよく分からない。

ちなみに全角コロンの文字コードはFF1A。どこをどう間違ったらFDFCになるのか謎である。

ただ、全角コロン(と全角数字)もこのリアル記号もUnicodeの「互換文字」に分類されるという共通点はある。
この互換文字というのは、過去の文字コードとの互換性を保つためにある文字で、基本的には使用は推奨されていない。
例えばこのリアル記号のように他の文字の組み合わせ(‎ر‎+ي‎+ا‎+ل‎)で表せる文字や、全角コロンのように実質的に同じ文字(半角:)が存在するものがこの互換文字に分類される。
ソフトによってはこの互換文字があるとそれと同等な通常の文字に"分解"して表示するものがあるのだが、それの誤作動なのかもしれない。

なおこの"分解"というのはUnicode用語で日常用語とは多少意味が違うので注意。
1文字が複数文字に分解される場合だけでなく1文字が別の1文字に変換されるのもこの"分解"に当たる。

余談だが、「互換文字」というネーミングはどうも気に食わない。
元々の英語では「compatibility character」と呼び、「compatibility(互換性)のための文字」というニュアンスが出ている。
だが、これを日本語にする時に「性」を取ってしまったために、ただ単に「互換な文字」というイメージになってしまい、意味が取りづらくなってしまっている。
まあ互換性文字というのもいまいちしっくりこないので誤訳とまでは言わないが。  

  • 韓ポケ - 購入~開梱
    2008年05月06日 07:03

    DSのポケモンの韓国語版を買いました。3/22に。
    포켓몬스터DP 펄기아」ってやつです。
    ブログが決まってから書こうと思っていたらこんなに時間が経ってしまいました。

    自分は海外版ゲームを買うときは大抵「メッセサンオー カオス館」か「ゲームハリウッド」で買っているのですが、今回韓国語版ポケモンはどちらにも売られていませんでした。
    特にカオス館の方は以前GB版の韓国語版ポケモンを買った店なので期待していたのですが…。

    それで仕方なく輸入代行業者を利用することにしました。初体験です。
    どこがいいかさっぱり分からないのでGoogleで「韓国 輸入」で検索して一番上にきた業者に決めました。GLORYとかいうところです。
    かなりの出費を覚悟していたのですが、これがかなり安い。全部込みで8350円。
    以前カオス館で買ったGB版韓国語版ポケモン銀は確か6000円くらいだったのでそれと比べれば多少は高いけど、なんとなく個人輸入ってもっとやたらと金がかかるものかと思っていました。
    ちなみに内訳は、
    本体価格35000ウォン→3880円
    手数料 1000円
    送料 2680円
    消費税 370円
    振込手数料 420円
    てな感じ。

    そして発送も早い。
    振込とか不在再配達とかで無駄に時間を食ったけどそれでも注文から1週間で手元に届いた。
    世界は狭いなあ。

    さて到着した箱が…
    箱
    でかい。

    もっと小さい箱を使えば送料安くなったんじゃないのかなとか思いつつ箱を開けると…
    箱を開けると…
    空!?

    瞬間、去来する思考 :



    …うん、とりあえず落ち着こう。





    …そういえばさっき振って音しなかったし。





    …妙に軽いなとは思った。





    …でもまさかね。





    …もう一度よく見てみよう。









    …あ。
    あった。
    こんなところに。
    この間1秒弱。肝が冷えたよ。

    しかしなかなか面白い梱包をしてくれますな。まさかのジャストフィット。

    -----

    と、これだけだとただの日記になってしまうのでこのブログっぽいことを書いておくと、

    この業者、韓国専門のくせに注文フォームがハングルを受け付けてくれません。
    サイトの文字コードも大部分がShift_JISでハングルを表示する気がありません。
    そんな中、サイト内の「ハングル講座」のページだけが文字コードがUTF-8でハングルと日本語が混在しています。
    それならサイト全部UTF-8にしてくれればいいと思うんですけどねえ。

    フォーム処理はまた別の話だと思うけど、ハングルを受け付けてくれないと注文が面倒です。
    商品名をわざわざカタカナ読みに直さなければならないのでややもすると似た音の語と区別がつかなくなりそうです。
    それにどうカタカナに直すかも問題です。
    例えば今回注文した「포켓몬스터DP 펄기아」ですが、この포켓몬스터[P'oK'etMonSŭT'ŏ]というのは普通にカナ表記すれば「ポケッモンスト」となります。
    でもこれはPocketMonsterという英語をハングル表記したものですから、それを踏まえてPocketMonsterのカナ表記である「ポケットモンスター」と書くべきかもしれません。
    펄기아はポルギアと読めますが、頭のはPearlのハングル表記でしょう。ならばパールギア? それともこれは日本語ではパルキアと呼ばれるポケモン名だからパルキアと書くべき?

    とりあえず「ポケッモンスト(ポケットモンスター)DP ポルギア」って書いておきましたけど。  

  • Macの濁点
    2008年05月03日 14:56

    最近たまにネットで見かけるようになった変な文字があります。
    「ズベズダ」
    こんな感じの。
    環境によって見え方が異なるのですが、よくて「ス゛ヘ゛ス゛タ゛」のように濁点が1マス使って表示、悪ければ「ス・ヘ・ス・タ・」や「ス?ヘ?ス?タ?」のようになってしまうと思います。

    でなんでだろうなーとずっと思っていたのがやっと理由が判明しました。
    偶然見つけたこのページによると、
    OS Xのファイル名はUnicodeで記録されますが、Normalization (正規化) として、かなの濁点半濁点つきの文字等を合成文字として、基底文字と結合文字 (濁点半濁点) に分離して保持する方式です。Windows NT、2000、XPもファイル名はUnicodeですが分離したりしません。結合文字未対応のソフトで扱うと、Windows 95、98、MeのShift_JISのファイル名との変換時に問題が出ますし、2000やXPとのやりとりで失敗することもあります。
    と、これはファイル名の話ですが、htmlファイルでも同じことが起こっているのではないかと思います。
    時期的にはOSXが出てからしばらくしてから出始めた気がするので何かOSX上のアプリケーションの問題かもしれません。

    こういう理由ですからきっとMac上では正常に見えるのでしょう。('08.12/23追記 : MacOSXで見ました。予想通り正常でした。)
    WindowsのUnicode対応が不十分と批判するか、現状のほとんどのブラウザで読めない文字を吐くMacを批判するか、両方の考え方があると思いますが私は後者です。

    ◆今日の例文◆
    ・ズベズダ(露 : Звезда : Zvezda)
    ロシア語で「星」の意味。カナ表記すると全て濁音である。