たまりば

パソコン・インターネット パソコン・インターネット三鷹市 三鷹市

【お知らせ】過去の記事が破壊されました
2013年09月26日 01:18

先ほど気づいたのですが、過去の記事の全てから、BMP外の文字(Unicode番号10000以上、サロゲートペア)が消えています。
例えば「」や「」といったものです。…と書いたつもりが、新規投稿も不可能なようです。実体参照は…「𛀁」ああ、これは大丈夫なようです。
BMP外の文字が普通に使えることはこのブログの最大の利点だったのですが、直らないようなら別のブログに移行することになるでしょう。
…面倒だなー。

とりあえず運営には文句を言ってみます。
なお、直ったとしても過去の記事の文字を全てチェックして書きなおすのは非常に面倒なのでやるかどうかは分かりません。

9/27追記
そういえばこのブログはエクスポート機能があったので試してみましたが、BMP外の文字はここでも消えていました。
消える前にバックアップしておくべきだったんだなあ…。
あ、あと運営にはお問い合わせから文句を言いました。返事はまだありません。

9/28追記
あ、運営から返信ありました。なかなか早いです。
7月のシステム移行(これ)が原因で、他にも同様の問い合わせが来ているそうで、
現在対応策を検討中だそうで。
2ヶ月たってまだ直らないのはまだしも、お知らせとかに報告すら無いのは事態を闇に葬ろうとしているのかと思えていい印象はしません。

11/2追記
10/30にメンテナンスがあったようで(これ)、ちょっと期待していましたが変化がありません。
そろそろ次の問い合わせを投げようかと思います。

2014/5/31追記
そういえば思い出しましたがまだ治ってません。
これはもう直す気は無いのでしょうね。
さてしかし、改めて考えてみると他のブログに移動したところでBMP外の文字以外の面で使い勝手が悪くなったら本末転倒です。
また、この一件で分かりましたが、ブログサービスというものはBMP外の文字が表示できるかなど気にしておらず、いつ仕様変更で使えなくなっても勝手に消されてもおかしくないようです。
であれば、もう自分で素のHTMLを書くくらいしか残された道は無いのかもしれません。
将来的にはそれもやりたいですが現状時間が取れないので、それまでは非常に不本意ながら、ユーザーのデータを破壊しておいて詫びの一つもないこのサービスを使い続けようと思います。
(あーでもメールのお詫び文の「表示されない文字について、ご不便をお掛けしまして」ってのにデータを消したことも含まれてるのかな…)
  

  • Macをクラッシュさせてるのは「アラビア語の文字列」じゃない
    2013年09月04日 00:57

    どうでもいい事ながら、なんか気になったので。

    問題は2点ある。
    よりどうでもいい方から言うと、アラビア文字はアラビア語だけに使われているわけではなくペルシャ語とかウルドゥー語とかにも使われる。
    件の文字列を「アラビア語の文字列」だというのなら、「ABCDEFGHI」のようなものは「ラテン語の文字列」と呼ぶべきだろう。
    言語と文字の名前はきちんと区別してほしい。

    そして件の文字列はパッと見アラビア文字が目立つが、アラビア文字以外に
    U+0337: COMBINING SHORT SOLIDUS OVERLAY
    U+0334: COMBINING TILDE OVERLAY
    U+0310: COMBINING CANDRABINDU
    の3種の結合文字が重ねて配置されており、今回のクラッシュを引き起こすのに重要な役割を果たしていることは間違いないだろう。それを無視しては問題の本質を見誤ってしまい危険である。
    例えばヘブライ文字で同じ問題が起こった時、「アラビア文字じゃないから大丈夫だと思った」などということにならないか心配である。