たまりば

  パソコン・インターネット パソコン・インターネット  三鷹市 三鷹市

JPEG圧縮を繰り返しても際限なく劣化するわけではない
2017年02月10日 01:47

ビデオテープのダビングやコピー機でのコピーは世代を重ねるごとに劣化が蓄積する。
同様にJPEG画像も、保存→開く→保存…と繰り返すと、
JPEG劣化_オリジナル
オリジナル
JPEG劣化_ずらし_1世代目
保存1回目
JPEG劣化_ずらし_9世代目
保存9回目
JPEG劣化_ずらし_17世代目
保存17回目
JPEG劣化_ずらし_49世代目
保存49回目
JPEG劣化_ずらし_97世代目
保存97回目
JPEG劣化_ずらし_201世代目
保存201回目
JPEG劣化_ずらし_497世代目
保存497回目
JPEG劣化_ずらし_1001世代目
保存1001回目
JPEG劣化_ずらし_2001世代目
保存2001回目
JPEG劣化_ずらし_5001世代目
保存5001回目
JPEG劣化_ずらし_10001世代目
保存10001回目
といった具合に劣化が蓄積して画質が際限なく落ちていき、最後には一面のノイズになってしまう…

…と誤った認識を持っている人が多い。

実際に試してみよう。使用するソフトは定番のImageMagick。
magick convert -sampling-factor 1x1 -quality 95 orig.png gen1.jpg
magick convert -sampling-factor 1x1 -quality 95 gen1.jpg gen2.jpg
magick convert -sampling-factor 1x1 -quality 95 gen2.jpg gen3.jpg
このようなバッチファイルをExcelとテキストエディタで作成し、実行する。
結果は次のとおり。
JPEG劣化_オリジナル
オリジナル
JPEG劣化_1世代目
保存1回目
JPEG劣化_17世代目
保存17回目

以上だ。
3000回くらい回していたのだが、確認してみると18回目で既に前回と同一の画像が出力されていた。だいぶ時間を無駄にした。
このように、繰り返し保存による劣化は早々に止まることが分かる。
なお今回は1種類に収束したが、以前試した時は3種類のローテーションになったこともあった。
また、見て分かる(分からない)とおり、1回目と17回目で差はほとんど無い。
念のため差分をとってみよう。
JPEG劣化_差分_1-17
全く見えないので64倍に強調したものも置いておく。
JPEG劣化_差分_1-17(×64)

そもそも非可逆圧縮の原理は、元データを少々変えて「圧縮しやすいデータ」を作り、それを可逆圧縮するものと解釈できる。
よって一度非可逆圧縮したデータを展開したデータは、既に「圧縮しやすいデータ」になっているため、同じ設定で圧縮すれば完全に可逆圧縮になってもおかしくない。
むしろ17回まで劣化が続くことの方が不思議といえる。
ではなぜかだが、JPEGの圧縮の根幹である離散コサイン変換(DCT)は本来は可逆なのだが、実際には有限の精度で計算するために丸め誤差が発生する。おそらくこれがJPEG再圧縮が不可逆な原因だと思う。
またどうもJPEGの仕様はあまり厳密でないようで、エンコードでは演算の精度をソフトの自由で選べたり、デコードもソフトによって結果が違ったりする。これも一因かもしれない。
(2/11追記)RGB→YUVの変換も丸め誤差が発生するので一因かもしれない。

さて次にパラメータを少し変えてみる。
JPEG劣化_オリジナル
オリジナル
JPEG劣化_サンプリング2×2_1世代目
1回目
JPEG劣化_サンプリング2×2_10世代目
10回目
JPEG劣化_サンプリング2×2_20世代目
20回目
JPEG劣化_サンプリング2×2_50世代目
50回目
JPEG劣化_サンプリング2×2_103世代目
103回目

今度は劣化が103回目まで続く。劣化の度合いも目に見えて分かる。色が褪せていて、特に赤が大幅にくすんでしまっている。
差分をとってみる。
JPEG劣化_サンプリング2×2_差分_1-103
少し見にくいので4倍に強調しておこう。
JPEG劣化_サンプリング2×2_差分_1-103(×4)
闇夜に光る眼のようで可愛い。

何を変えたかというと、カラーサブサンプリングだ。
カラーサブサンプリングは、クロマサブサンプリングや色成分間引きと呼ばれたり、単にサンプリングやサンプリング比という名の設定項目で設定したりする。名前が定まっておらず面倒な概念だ。
先の17回で劣化が止まったものは、カラーサブサンプリングがOff、別の言い方をするとサンプリングが1x1や4:4:4と呼ばれるものだ。この設定では輝度成分と色成分を元の解像度のまま処理する。この時、画像は8×8のブロックごとに処理され、隣のブロックとの間で影響を及ぼすことはない。
一方103回の方は、カラーサブサンプリングがOn、サンプリングが2x2や4:2:0と呼ばれる設定であり、輝度成分は元解像度で、色成分は縦横1/2に縮小してから処理をする。
この縮小で単純に2×2ピクセルを平均するのであれば16×16のブロック内に影響が留まるだろうが、どうもそうではなく線形補間か何かをされているようで、ドットの色が16×16pxの境界を越えてにじむ現象が見られる。これにより隣のブロックの色が圧縮に影響し、次回は隣の隣のブロックにまで波及し、と際限なく影響を与え合う。厳密なことは分からないがこれが劣化が長く続く理由ではないかと思う。

なので劣化が蓄積するというのは、カラーサブサンプリングOnの設定においてはある程度正しい。
ただしそれにしても際限なく劣化するということはないし、JPEGが全てそのように劣化するわけでもないことは上で示したとおりだ。

さてもうひとつ、冒頭の例のように完全なノイズにまで際限なく劣化させるにはどうすればよいだろう。劣化しそうな方法をいろいろ試してみた。
まず圧縮率を毎回変えたら量子化の閾値が変わることで劣化が続くのではないかと考えたのだが、駄目であった。1万回繰り返してもほぼ劣化が見えなかった。(同じ画像が続くことは無かったので何パターンかのローテーションになっていたようだ)
次に90度回転を試したがこれも同様であった。今回使ったJPEGの量子化行列は縦と横で対称でないのでそれによるゆらぎを期待したのだが…。
そこで毎回画像の位置をずらしてみることにした。7回右下へ1pxずらしたあと、1回左上に7pxずらして戻すの繰り返し。これは見事に成功、これでできたのが冒頭の画像だ。
なぜこれが上手くいくかは、正確なことは分からないが、特定のドットに注目するとそのドットは8×8のブロック内で位置が毎回変わるようになっており、これで誤差が波及し続けるのが一因だろう。
サンプリング2x2の時は止まってしまったのでそれ以外に何かあるのだろうが、よく分からない。何か誤差が発振するような機構があるのだろうか…。
なお90度回転も、画像サイズが8×8の倍数でない場合はずらすのと同じことになる。

以上、まとめると
・単純に同じ設定で圧縮を繰り返すだけでは際限なく劣化することはない。
・ただしサンプリングを落とした場合は少々劣化が続く。
・設定を変えても際限なく劣化はしてくれない。
・位置の移動を伴うと際限なく劣化した。

JPEGの劣化は奥が深い。  

  • ゲームボーイの吸い出し機を作った (後編)
    2017年01月16日 22:44

    前編の続き。プログラム側について。

    まずは単純に読むことを試みる。
    手持ちの中でバンク切り替えなし(32kB)のソフトとしてDr.マリオを選択。

    バンク切り替えが無ければアドレスを出してデータを読むだけ。
    …とはいえCLKとかCSとかRDとかどう制御すればいいのか。
    GBのカートリッジの仕様くらいいくらでも見つかると思っていたのだが、ROMの読み出し方法は常識なのか、細かい解説が意外と見つからない。
    結局、分かってみると単純で、
    /RDがLにアサートされている間、アドレスピンで指定されたアドレスのデータが、データピンに出る
    というだけのことだった。
    つまり読み出すには、/RDをLにアサートしたままアドレスを順次変え、データピンを読むだけでよい。
    これが分かるまでに/RDをH/L切り替えてしていた。
    あと/CSはSRAMを読む時アサートするものだった。

    プログラミング自体もなんだかんだで苦労した。
    やはり合っているか分からない操作を正しく組めているか分からない機械にプログラムするのは疑心暗鬼に陥ってだいぶ精神を消耗する。
    まずシリアル通信するところからしてうまくいかない。
    シリアルポートが全く反応しなくて焦った挙句Windows10へアップグレードした時にケーブル類全部抜いてたのを戻してなかっただけだったりもした。
    何か出るようになったと思えば文字化けしている。これはどうもTeraTermのバグかWindows10との相性のようで、最新版を使ったら正常であった。
    新しいPICを使う際には毎回のようにGPIO以外の機能を切っていなくて問題が起こるのだが、今回もまんまとその罠にはまった。
    ADコンバータとコンパレータを切ったまでは良かったのだが、それで読もうとしても何も読めない(FFが読める)。
    ポートのレジスタを直接インクリメントしてたのがまずかったかと思い、別の変数をインクリメントしてそれを出力するようにしたところ何かは読めるようになったが、全体にわたりほぼ確実に8バイトづつ同じ値が取れる。
    つまりアドレスの下3bitが何かおかしい。そのピンを調べると、LCDドライバの電圧生成機能がデフォルトでONであった。
    ということはポートのレジスタを直接インクリメントすること自体は問題なく、最下位bitの書き込みが無視されていたせいでインクリメントできていなかったんだな。

    というわけでついにDr.マリオが読めた。
    Dr.マリオ

    次はバンク切り替え…の前に色々なソフトをバンク0だけ読んでみることにした。
    するとポケモンYellowやポケモンカードなど読めるものもあるが、ポケモンSilverが読めない。
    読めないというのは、ほぼ全てFFが返ってくる。ごく稀にFF以外のものが返ってくることもあるのがまた不可解である。
    FFでない箇所のパターンは規則的で、なにかありそうである。2進数で「xxxx xxx1 0000 000x」と「xx00 0110 0000 0001」、つまり0100, 0101, 0300, 0301,…と0601, 4601がFFでない。
    不要なはずのクロックだがMBCを積んでいることもあり何か変わるのではないかと入れてみる。当然変わらず。
    …散々悩んだ挙句、電圧不足であった。
    いつもPICを動かす時はEneloop2本(2.6V程度)を使っていて、使いやすい5V電源を持っていないこともあり、とりあえずそれでやっていたのだが、GBの電圧は5Vなので動かなくてなんの不思議も無いのであった。
    Dr.マリオを始めいくつかのソフトで(バンク0は)読めていたので発覚が遅れた。

    改めてバンク切り換えだ。
    バンクの少ない(最少の4バンク)ものとしてQIXを選択。
    バンク切り換えの手順はMBCによって少々違うが、基本的に特定のアドレスにデータを書き込むだけである。
    書き込むべきデータを入れていなかったり、PICのIOを入力のまま出力したつもりになっていたり、書き込むアドレスを間違ったりして手間取ったが、まあまあすんなりと読めた。
    QIX

    さて続いて本命のポケモンSilverだ。
    128バンクあるが、バンク切り換えのやり方は同じなので、単純に数が多いだけ。難しいことは何もない。
    しかしなぜか途中でデータが飛ぶ。読み取ったデータを見るとファイルサイズが想定より小さい。
    今までこのような大量のデータをシリアルで受信したことは無かった。シリアル通信の信頼性はこの程度なのだろうか。
    だがそれは想定の内。1バンクごとに目印を入れてあるのでどこで抜けたかは分かる。何度か読んで正常な部分を切り貼りすればよいだろう。
    …と思っていたのだが、不思議な事に常にエラーが出ている場所がある。
    バッファ切れを疑ってバッファ量を変えたりウェイトを入れたりしてもなんとなく変化はあるものの直らず。
    データの問題かと思いXOR 0x55したデータを送ってみると抜けの量はほぼ変わらず、抜けの位置が変わった。特定のデータが来ると問題が起こるのだろうか。
    速度を落としてみるとだいぶ改善した。抜けが6バンクまで減ったので試しに起動してみると、一応起動はした。
    ポケモンSilver_データ抜け1ポケモンSilver_データ抜け2
    このような分かりやすいバグった表示になるものなんだなあ。
    なお部屋に出口がないので進めなかった。その後もう1バンク正常に取れたのでそれと合わせると部屋から出られたがBGMが異常になったりする。
    しかしここで何度とってもほぼ同じ場所でエラーを起こす。
    やはり速度を落とすだけでは解決しない。特定のデータが問題という線で考えてみよう。
    改行の処理に時間が掛かっている可能性を考えてCRの後にウェイトを入れてみる。むしろ悪化。
    あとは…エスケープシーケンス。何らかのエスケープシーケンスが来るとそれの処理に時間がかかってデータを取りこぼすのではないか。
    ここでTeraTermを調べて、受信した文字をすべて表示するデバッグモードがあることを知る。
    デバッグモードで受信するようにしたところ、一切取りこぼさなくなった!
    ポケモンSilver
    後で調べたところ、制御シーケンスに「1B 63: 端末リセット」というものがあるらしい。
    つまりこのバイト列が来るとTeraTermがリセット動作を起こし、その間に来たデータを取りこぼしていたようだ。
    調べてみると「1B 63」は最後まで読めなかった5バンク中の3ヶ所にあった。残り2ヶ所やそれ以前のエラー箇所は分からないままだがたぶん他のエスケープシーケンスだろう。
    デバッグモード以外にエスケープシーケンスを無視する方法がないか調べたのだが、見つからなかった。
    人が読む文字列を出す時は改行は使いたいのだが、致し方ない。

    次に困ったのがX(エックス)だ。バンク切り替えができない。
    調べてみるとこれに使われているMBC2はバンク切り替え時に書き込むアドレスに制限があり、今まで使っていた0x2000では駄目だった。
    と0x2100に変えてみたが、やはりバンクは切り替わらない。
    そこで読み取れたバンク0のコードを見てみることにした。この中にバンク切り替えのコードがあるはずである。
    するとやはり0x2100に書き込んでいる。
    合っているのにおかしいなと思い更に調べると、バンク1に変更する時は0x2100だったのだが、バンク2では0x2101、バンク3では0x2102…と、バンクNに変更する時0x2100+(N-1)に書き込むようになっていた。
    1少ないのは書き込み後のインクリメントの関係だろう。ということでバンクNに変更する時は0x2100+Nに書き込むようにコードを書き換えてみると、見事読み取りに成功した。
    なんだろう。バスコンフリクトだろうか。ファミコンのMMCでバスコンフリクトを起こすものがあるという情報はあるが、GBで起こるというのは見たことがなかった。
    X(エックス)

    さて次はニンテンドウパワーのGBメモリの読み取りを試みている。
    これは複数のMBCの動作を再現する特殊なコントローラを積んでおり、普通のバンク切り換えとは異なるコマンドを入れる必要があるらしい。
    色々試しているのだがまだ一切反応がない。一番つらい時期だ。
    読み取りができたら、どうも書き込みも出来るらしいのでやりたい。自作ソフトを実機で動かすのは夢である。

    ただその前に、どうも読み取りが安定しないのでどうにかしたい。
    今まで読めていたソフトでも読めなくなったりしている。
    断線しかかっているとかだろうか…。  

  • ファミコンで全画面に任意の画像(ただしモノクロ)を表示
    2017年01月14日 00:00

    ファミコンは普通には全画面に自由に画像を表示できないことはよく知られている。
    でもモノクロ2値ならできることに気づいたのでやってみた。
    ファミコン全画面_猫耳とりあえず猫耳。
    ファミコン全画面_羽根っ娘酉年らしく羽根っ娘。
    ファミコン全画面_漢字全画面任意なのが分かりやすい図柄も。

    まず前提として、ファミコンのBG(背景)面は32×30=960個のキャラクタで構成されるが、BGの(スプライトも)キャラクタパターンの指定は1バイトなので、一度に256種類からしか選べない。
    よって普通にはBGだけでは256キャラ、画面の1/4強しか埋められず、スプライトを8×16ドットモードで最大の64個使って128キャラ用意してやっと384/960=40%にしかならない。
    何らかのマッパーを使えば描画中にバンク切り替えで全画面を別のキャラクタで埋められるが、マッパーを使ってできるのは面白くないので今回考えないことにする。

    そこで今回の手法だが、パレットの色分けとキャラクタテーブルの描画中切り替えで実質キャラ数を4倍に増やしている。
    まずパレット。
    ファミコンのキャラごとの色数は4色だが、これを2色しか使わなければ例えば「白黒白黒」と「白白黒黒」の2種類のパレットを左右で使い分けることで1つのキャラで2つの絵を表示することができる。
    00011011

    0111111111111100
    1111111111111111
    1111000000001111
    1111010101011110
    1111111111111111
    1111101010101111
    1111010101011111
    1111010101011110
    00011011

    0111111111111100
    1111111111111111
    1111000000001111
    1111010101011110
    1111111111111111
    1111101010101111
    1111010101011111
    1111010101011110
    00011011

    0111111111111100
    1111111111111111
    1111000000001111
    1111010101011110
    1111111111111111
    1111101010101111
    1111010101011111
    1111010101011110
    比較のために単一のパレットで表示したものがこちらだ。
    単一パレット表示

    次にキャラクタテーブル。
    「一度に256種類からしか選べない」と書いたが、この「一度に」の部分がポイントだ。
    仕組みを詳しく言うと、定義できるキャラは256個の領域が2つあり、BGと8×8のスプライトはそれぞれその2つのどちらの領域からキャラを選ぶかを設定できる。同じ領域をBGとスプライトの両方で使うこともできる。
    (なお今回関係ないが8×16のスプライトは一度に2キャラを使うので、どちらかの領域から選ぶのではなく、2つの領域を合わせた512キャラを2キャラづつの256組と見たものから選択する)
    ここでこの「どちらの領域から選ぶか」の設定は画面の描画中にも切り替えることができる。これにより上半分と下半分で別のテーブルからキャラを選ぶことが可能なのだ。
    比較のためにこの切り換えを行わなかったものがこちら。
    切り換えを行わない表示

    基本的なアルゴリズムは以上だ。
    実際のコードは下に置いたが、少々細かい解説を加えておく。

    今回CHR-ROMでなくCHR-RAMを使っている。
    そのためまず最初にPRG-ROMに持っている画像データを元にCHR-RAM上にパターンテーブルのデータを生成している。
    これは事前に適切な並びにしたデータをCHR-ROMに持っておけば必要ない操作だ。
    ただ、この並べ替えのプログラムは、ファミコン自体で行うか外部で事前に行うかの違いでどうせ書かなければならない。
    ならば1つにまとめた方が扱いが楽なのでこうした。
    下に書いたコードと、任意のモノクロビットマップを用意するだけで、NESASMでビルドできる。

    このパターンテーブル書き込みのコードは少々複雑だが、やっていることは単純に、256×240ドットの1bitビットマップを適切な順に並び替えているだけだ。
    パターンテーブル前半0x0000~0x0FFFが画像の上128ドット、後半のうち0x1000~0x0DFFが画像の残り。0x1F00~0x1FFFには後述の通り0x0F00~0x0FFFと同じものを重複して配置している。

    「どちらの領域から選ぶか」の設定、つまりパターンテーブルのベースの切り換えだが、このような描画中のタイミング合わせはファミコンではふつう0番スプライトヒットフラグをポーリングすることで行う。
    だが今回別の方法をとった。
    0番スプライトヒットはBGとスプライトが共に不透明な点でしか起こらない。つまり画像の当該箇所が透明なとき使えない。
    今回任意の画像を表示できるようにしようとしているのでこれは困る。
    代わりにあまり知られていないスプライトオーバーフローフラグを使った。
    これはライン上にスプライトが9個以上並んで横並び数制限を越えたときに立つはずだったフラグだ。
    このフラグはスプライトが透明でも変わらず立つので、BGの内容に関係なく使えて便利だ。
    ただ重大な欠点があって、このフラグ、アドレスの桁上がりの誤りで別のデータを参照するせいでまともに動かないという、致命的かつしょうもないバグが存在する。
    使い物にならないと思うかもしれないが、バグの条件は厳密に判明している。
    詳しくはNesDevの「PPU sprite evaluation」のページを読むとよいが、
    スプライト番号順にライン内に存在するかをチェックし、8つめが見つかった次のチェックまでは正しく、その次から誤ったアドレスを参照しだす。
    ここから、
    ・スプライト数が7つ以下なら、必ずフラグは立たない
    ・スプライト数が9つ以上の時、8つめと9つめのスプライト番号が隣り合っていれば、必ずフラグが立つ
    ということが言える。
    なので今回はスプライト番号順に連続した9つを目的の場所に置くことで確実にスプライトオーバーフローフラグを立てることにした。
    というか残りも面倒なので同じ位置に置いた。

    切り換えタイミングだが、画像を単純に上下に分割した場合、きっちりHBlank中に切り換えを起こすようにしないとこのように画面が乱れてしまう。
    ファミコン全画面_画面乱れ
    そのレベルで合わせるには描画中のスプライトの判定処理の流れをきちんと理解してコードを書かねばならないが、今回面倒なのでそこまではしなかった。
    その代わり、1列分(8ライン)のキャラをパターンテーブル前半と後半で重複させておいた。これでこの8ラインの中で切り替えれば画面を乱さないようにできる。

    画像データのインクルード部分は「画像データ(生)」と「画像データ(BMP)」の2種類を用意した。(生)は256×240bitの生データを使う時用で、(BMP)はWindowsのMSペイントで出力したBMPファイルをそのまま使えるようにヘッダ分だけずらした位置に配置するものだ。
    これを使う時は、まずペイントで適当に描いた絵を上下反転
    ペイントで描いて上下反転
    モノクロビットマップで保存して
    保存
    できたファイル名をソースに書き込んでビルドするとできあがり。
    ビルドした表示
    ぜひ試してみてほしい。

    ; 全画面に任意のモノクロ2値のビットマップを表示する
    ; NESASM v3.1でビルド、NNNesterJとNintendulatorで動作確認している。

        ; INESヘッダー
        .inesprg 1 ; PRG-ROM容量(0x4000=16KB単位)
        .ineschr 0 ; CHR-ROM容量、CHR-RAMでは0
        .inesmir 0 ; Don'tCare(水平ミラーリング)
        .inesmap 0 ; マッパーなし

        .bank 0

    ; レジスタ名定義(してたりしてなかったり、してるのに使ってなかったり)
    PPUMASK = $2001
    PPUADDR = $2006
    PPUDATA = $2007

    ;(グローバル)変数定義
    ;RAMの連続したアドレスにラベルを付けたいだけなのだがどうもROMに値をとっている。
    ;どうせ上書きされる場所で実害ないからいいけど、もっとまともな方法があるのだろうか…。
    ;まあとりあえず今回はこのままでいいや。
        .org $0000
    chrptr .dw 0 ;CHR-RAM書き込み時のポインタ
    cnt1 .db 0 ;カウンタ変数
    sprpos .db 0 ;スプライト書き込み時のポインタ
    posx2 .db 0 ;何だっけ

    ;割り込みベクタ
        .bank 1     ; 0x2000(8KB)単位。ファイルが全16KBなのでbank3でなく1。
        .org $FFFA  ; BFFAだけど。

        .dw intvb   ; VBlank割り込み
        .dw init    ; リセット割り込み。起動時とリセット時
        .dw 0       ; ハードウェア割り込みとソフトウェア割り込み

        .bank 0
        .org $8000

    init:
    ; PPUレジスタに書き込みできるようになるまで時間がかかるらしいので待つ
        ldy #25
    .loop:
        dex
        bne .loop ;5*256=1280 ;30000 30000/1280=23.4375
        dey
        bne .loop

    .loop2:
        lda $2002  ; VBlank待ち
        bpl .loop2

        ; VBlankのNMIを無効
        lda #%00110000
        ;     ^||||||| VBlank開始時にNMI発生
        ;      ^|||||| PPUマスター/スレーブ
        ;       ^||||| スプライトサイズ 0:8x8 1:8x16
        ;        ^|||| BGパターンテーブル
        ;         ^||| スプライトパターンテーブルアドレス
        ;          ^|| VRAMアドレス増分 0:1 1:32
        ;           ^^ ベースネームテーブルアドレス 0:2000 1:2400 2:2800 3:2C00
        sta $2000
        lda #%00000110 ; 初期化中はスプライトとBGを表示OFFにする
        sta $2001

        ; パレットRAM=$3F00
        lda #$3F
        sta $2006
        lda #$00
        sta $2006

        ldx #$00
    loadPal:
        lda pallet, x
        sta $2007
        inx
        cpx #32
        bne loadPal

        lda    #50
        sta    posx2

    setBg: ;BGのネームテーブルを適宜セット
    ; 00,01,...0F,00,01,...0F
    ; 10,11,...1F,10,11,...1F
    ; ...
    ; F0,
    ; 00,
    ; ...
    ; D0,
        ; $2000: BG1 name table
        lda #$20
        sta $2006 ;PPU_ADDR
        lda #$00
        sta $2006
        ldx $00
        lda #30
        sta cnt1
        ldy #0
    bgLoop0:
        ldx #16
    bgLoop1:
        sty PPUDATA
        iny
        dex
        bne bgLoop1
        tya
        sec
        sbc #$10
        tay
        ldx #16
    bgLoop2:
        sty PPUDATA
        iny
        dex
        bne bgLoop2
        dec cnt1
        bne bgLoop0

    ;CHR-RAM書き込み
    setChrRom:
        lda #0
        sta chrptr
        lda #high(chr)
        sta chrptr+1
        ldy #$00
        sty PPUADDR
        sty PPUADDR
        ldx #30

    .loop
        lda [chrptr],Y
        sta PPUDATA

    ; 8: タイル縦px数 000yxxxx ~ 111yxxxx
    ;Y+=20
        tya
        clc
        adc #$20
        tay
        bcc .loop ; if no carry loop
    ; 2: 色bit 0000xxxx, 0001xxxx
    ;Y+=10
        tya
        eor #$10
        tay
        and #$10
        bne .loop ;if !y&10 loop
    ; 16: 横タイル数 00000000 ~ 00001111
        iny
        tya
        and #$0F
        bne .loop; if neq loop
    ; 30: 縦タイル数
        ldy #$00
        inc (chrptr+1)
        dex
        bne .loop

    setChrRomOverlap: ;BGのベースを変える境目でオーバーラップさせておく
        ldy #$1F
        sty PPUADDR
        ldy #$00
        sty PPUADDR

        lda #high(chr)+$0F
        sta chrptr+1
        ldy #0
    .loop
        lda [chrptr],Y
        sta PPUDATA

    ; 8:タイル縦 000yxxxx ~ 111yxxxx
    ;Y+=20
        tya
        clc
        adc #$20
        tay
        bcc .loop ; if no carry loop
    ; 2:パレットbit 0000xxxx, 0001xxxx
    ;Y+=10
        tya
        eor #$10
        tay
        and #$10
        bne .loop ;if !y&10 loop
    ; 16: 横タイル数 00000000 ~ 00001111
        iny
        tya
        and #$0F
        bne .loop; if neq loop


    ;属性テーブル (BGパレット)
        ldy #$23
        sty PPUADDR
        ldy #$C0
        sty PPUADDR
        ldx #8
    attrloop:
        lda #$00 ; 左半分 00 00 00 00
        sta PPUDATA
        sta PPUDATA
        sta PPUDATA
        sta PPUDATA
        lda #$55 ; 右半分 01 01 01 01
        sta PPUDATA
        sta PPUDATA
        sta PPUDATA
        sta PPUDATA
        dex
        bne attrloop

    ;scroll
        lda #0
        sta $2005
        sta $2005

        ; スプライト配置
        lda #$00
        sta $2003 ; OAMADDR

    ; Byte 0-3: Y,TileNo,Attr,X
    ; Attr:
    ;76543210
    ;||||||||
    ;||||||++- Palette (4 to 7) of sprite
    ;|||+++--- Unimplemented
    ;||+------ Priority (0: in front of background; 1: behind background)
    ;|+------- Flip sprite horizontally
    ;+-------- Flip sprite vertically

        ldx #64
    sprLoop:
        lda #$7B ; BGのベースの切り替わりあたり
        sta $2004
        lda #$E1 ; 1:E0 空スプライト
        sta $2004
        lda #$00
        sta $2004
        lda #$B0 ; 特に意味はない
        sta $2004

        dex
        bne sprLoop

        ; 表示開始
        lda #%00011110    ; スプライトとBGの表示をONにする
        sta $2001

    intvb:
        lda #%11100000 ;BGパターンテーブルベース=0
        sta $2000

    waitVBlankEnd: ;VBlank終了時点でスプライトオーバーフローフラグが消えるのを待つ
        lda $2002
        and #$20
        bne waitVBlankEnd
       
    waitSprOvr: ;スプライトオーバーフローフラグが立つのを待ってBGパターンを切り替える
        lda $2002
        and #$20
        beq waitSprOvr

        lda #%11110000 ;BGパターンテーブルベース=1
        sta $2000

    waitInt:
        jmp waitInt

    ;色0・色1
    C0 = $0F
    C1 = $30

    pallet:
        .db C0, C1, C0, C1, C0, C0, C1, C1, C0, C0, C0, C0, C0, C0, C0, C0
        .db C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0, C0

    ; 画像データ(生)
        .bank 1
        .org $A000
    chr:
        .incbin "rawfile.bin" ; 画像。256×240/8=0x1E00バイト

    ; 画像データ(BMP)
    ;    .bank 1
    ;    .org $A0C2
    ;    .incbin "bitmap.bmp" ; 画像。MSペイントなどで作成したモノクロビットマップ
    ;    .org $A100
    ;chr:
      

  • 最近のWindowsのビットマップフォントの太字
    2017年01月09日 18:49

    MSゴシックのようなウェイト(太さ)が1種類しかないビットマップフォントをテキストエディタやHTMLなどで太字指定すると、自動生成された太字が表示される。
    単純な太字化アルゴリズムとして古くから用いられているのが横方向に1px太らせる手法で、WindowsでもXPまで長らく使われていた。
    単純な太字
    この手法の問題点は、1pxの隙間を開けて縦線が並んでいる箇所で隙間がつぶれてしまうことだ。
    「棚」「鵬」などの縦線の多い字を小サイズで表示すると黒い塊になってしまう。
    隙間が潰れる

    このつぶれを避ける改良版のアルゴリズムとして、「横に1px太らせてつぶれるなら、太らせない」というものがある。
    スーパーの太字
    なお、右に太らすか左に太らすかで2種類存在する。
    スーパーの商品の値札の文字や、Javaで作られたGUIの文字表示に使われているのをよく見かける。
    最初にこれに気づいたのがスーパーの値札だったので、自分の中でこれは「スーパーの太字化アルゴリズム」と認識されている。
    これを最初に見かけた時は画期的だと感心したものだが、これにも欠点はあって、元々連続的な線であったところが太くなるところとならないところが混在すると形状が乱れて文字が読みにくくなってしまう。
    スーパーの太字_乱れ
    図の赤で示したあたりが不自然な形状になっている。

    そして本題の最近のWindowsの太字だ。これが更に画期的なのである。
    最近のWindowsの太字
    これは最初に気づいたのがWindows7のインストール画面で、Windows7で始めて実装されたものと思っていたのだが、確認してみるとVistaでも使われていた。
    Vistaにも最初からあったのに気づいていなかったのか、それともアップデートで実装されたのか分からない。ともかく、XPまでは無く、7からはある。
    この手法の特徴は見て分かるように白黒2値でなく中間調の灰色を使っている点だ。
    単純な太字化で問題ないところでは黒で横に1px太らせ、単純にはつぶれてしまうところでは灰色で太らせる。
    ここでスーパーのアルゴリズムと異なり、縦に連続する黒ピクセルは常に同じ色で太らせる。これにより形状が乱れることを防げている。

    しかしこのアルゴリズムは思った以上に複雑で色々とわからない点がある。
    Windows太字の不明点
    ・黒にするか灰色にするかの判断
    単純に太らせると別の点に接触する場合は灰色なのかと思いきや、そうでない場合がある。例えば「棚」の赤で示した木偏の縦線は下2pxが隣の月に接触しているが構わず黒で太らせている。

    ・灰色の濃さ
    接触する点が多いほど薄くなっている傾向は分かるのだが、細かく見るとそう単純ではない。
    「鵬」の月の中と、月と月の間は両方とも100%接触なのだが色が違う。率だけでなく、ドット数や分断の有無で変わるのだろうか。
    「繭」の一番左の灰色は、5ドット中4ドット接触だが、100%接触の鵬のドットより色が薄い。

    ・ひとつづきに扱う範囲
    「繭」の赤で示したドットは、真ん中と下は横線で隔てられているが同じ色で太っている。また上は白ドットで隔てられていて違う色で太っている。
    白ドットで隔てられた時は別扱いかと思いきや、青で示したドットは同じ色で太っている。(ともに100%接触だが、ドット数が違えば色は変わるものと思われる)

    そんなわけで詳しいアルゴリズムがずっと気になっているのだが、不思議な事にこのアルゴリズムについてネット上で情報を見かけない。Windows7当時から探しているのだが、本当に1つも見つからない。
    何か情報があればぜひ教えて欲しい。  

  • 浮動小数点数の10進指数表示のアルゴリズム
    2016年12月28日 01:28

    printfなどで浮動小数点数を10進指数表示するとき、倍精度では17桁の仮数で適切に出力すれば読み込んだ時元の値に戻ることが知られている。
    この適切な出力アルゴリズムがどうなっているのか昔から気になっていた。

    多倍長整数で1の位まで計算すれば明らかに正しい出力を出せるが、2進1024桁(10進308桁)だか何かそのレベルの桁数が必要になる。
    最終的に17桁しか必要でないのに途中に308桁もの計算をするのはコストが大きく無駄に思える。他に方法が無いものだろうか。
    log210nだかlog102nだかの表を(浮動小数点数で)持っておけば多数桁を保持すること無く10進指数表示ができそうだ。
    しかしこれは表の値の精度に依存することになる。全ての値で正しい出力が出せるような気がしない。ちょうど丸めの境目あたりの数になった時に間違った出力にならないだろうか。

    質問サイトに質問しても有用な回答が得られず悶々としていたのだが、先日偶然見つけたアルゴリズムの論文で疑問が氷解した。
    Printing Floating-Point Numbers Quickly and Accurately with Integers
    これによれば、
    ・1970年台~1980年台を通して多くのライブラリが誤った(wrong)表現を生成していた。
    ・Coonenが1980年と1984年の論文で拡張精度を使った正確(accurate)な手法を示したが広まらなかった。
     (拡張精度というとx87の80bit仮数のものが有名だ。8087の発売はちょうど1980年なのでこれを使ったのだろうか。)
    ・SteeleとWhiteの1990年の論文の多倍長整数を使うDragon4アルゴリズムが広まった。
    という。

    そしてこの論文で示されているアルゴリズムはGrisuという名で3種類あり、
    ・Grisu1は、入力の浮動小数点数の仮数の桁数より2bit以上多い整数を使い、正確な出力を返す。Coonenの手法の一般化。
    ・Grisu2は、正確かつGrisu1より短い出力を返す。
    ・Grisu3は、正確かつ最適(optimal)な出力を返すか、あるいはエラーを返す。

    最適とはどういうことかというと、例えばGrisu1では、「0.3」(に相当するdouble)に対して「29999999999999998e-17」を出力する。(2.9999999999999998e-1って書き方のほうが馴染みがあるが本質に違いはない)
    0.3と29999999999999998e-17はdoubleに変換した時同じ値になるので、どちらの表記も同じく正確である(accurate)。しかし、どうせなら短い「0.3」のほうで出してほしいと考えるのが自然だろう。
    これはつまり、「同じ浮動小数点数に変換される10進表記が複数あるなら、仮数の桁数の少ない方を優先する」ということだ。加えて「同じ桁数なら、真の値に近い方を優先する」という条件も付けたものを最適(optimal)と呼んでいるようだ。

    Grisu1のアルゴリズムだが、論文や実装「grisu.net」を見たところ特殊なことは何もやっていない。単純に、(入力より少し仮数の多い)自作の浮動小数点演算で適切な10の階乗を掛けてから10進変換しているだけのようだ。10の階乗の表を作るあたりの効率化に何かあるようだが、本質ではないので読んでいない。
    これで正確な出力になる証明も、真面目に読んでいないが、たぶん地道に誤差の最大値を追っていっているだけだ。

    Grisu3は、最適な出力を出せなければDragon4を使うというものだから、結局(あらゆる入力に対して)最適な出力を出すには多倍長整数演算を使わなければならないということになる。
    テーブルメーカーのジレンマというやつだろうか。

    以上より、冒頭の疑問に対する答えとしては、
    ・正確なだけでよければ仮数+2bitの精度の演算で単純なアルゴリズムで出力可能。1980年からある。
    ・最適も求めると多倍長整数を使うほかない(少なくとも2010年の時点では)。
    ということになろう。
    自分の直感はいい線をいっていたが、「正確だが最適でない」表記という考えが不足していた。  

  • PCのキーボードのアーウが反応しなくなったあどうすえばよいか
    2016年07月17日 04:34

    PCのキーボードの「R」が反応しなくなったことをその「R」の使えないキーボードで打ったツイートが少し前に話題になっていた。
    ここで反応しなくなったキーが「R」だというのが絶妙だ。
    Rを使わないとアールと文字名を打つこともできず、アーウという間の抜けた字面になるのがよい味を出している。
    これが
    Aエー、Cシー、Eイー、Fエフ(EHU)、Gジー、Hエイチ(EITI)、Jジェー(ZYE-)、Lエル、Qキュー、Vブイ、Wダブリュー、Xエックス、Yワイ
     ではその文字を使わなくても文字名が打ててしまう。
    Bイー、Pイー、Kエー
     ではE・Aに読めてしまい分かりづらい。
    Dヒー、Tヒー
     は「ディー」や「ティー」の発音の中に存在しない「h」が出てきてしまい文字名に結びつきづらい。
    Iア、Oー、Uy-
     この辺は情報が足りなすぎなんだか分からない。
    Mエウ、Nエウ、Sエウ
     これらはなかなかよい。「Nのいぎどなりのエウ」などよい間の抜けぐあいだ。ただ3つのどれか分からないのは欠点か。
    Zエット
     これもなかなか面白い響きだ。「Shiftの右隣のエット」「Xの左隣のエット」が打ててしまうのが多少残念。



    さてそれはそうと、R(など英字キー)が打てなくなった時の対処法を考えてみよう。
    なお当該ツイートの画像はMacっぽい気もするがMacはよく知らないので主にWindowsについて考える。

    まずはRが打てなくなったことを伝えるために1回だけでいいから「R」の文字を入力する方法を考えよう。

    色々あるが、面白いところからいくと、英単語をカナ表記から変換する方法がある。
    MS-IMEでは例えば「かー」を変換すると「CAR」が出せるので、Rを打たなくてもRの文字を出せる。
    他の文字も考えてみると例えば
    BらむLAMB
    DしゅみっとSCHMIDT
    IらてんLATIN
    KないふKNIFE
    MあんばーAMBER
    NこらむCOLUMN
    OかむCOME
    PれしーとRECEIPT
    SきっずKIDS
    TくりすますCHRISTMAS
    UかっとCUT
    ZぴっつぁPIZZA
    といった出し方があるだろう。
    なおZは「じー」でも出たりする。

    他に、どこかからコピペしてくる方法もある。
    Webブラウザで「ASCIIコード表」など適当な語句で検索すれば見つかるだろう。

    まともな方法では、IMEパッドの手書きや
    IMEパッドの手書き
    文字一覧、
    IMEパッドの文字一覧
    ソフトキーボードが使える。
    IMEパッドのソフトキーボード

    文字一覧と同様のもので、「文字コード表」もある。
    文字コード表
    名前を指定して実行から「charmap」…が打てないのでどうにかして探そう。

    変わったところで、Alt+テンキーでの文字コード入力。
    日本語WindowsではShift_JISの文字コードを入力する。Rなら0x52(=82)なので、Altを押しながらテンキーの8,2を順に押し、Altを離すとRが入力される。
    またレジストリのHKEY_CURRENT_USER\Control Panel\Input Methodに文字列値「EnableHexNumpad」を作成し値を「1」にするとAltを押しながら「+」を頭につけた16進のUnicodeで入力できるようになる。Shift_JIS外の文字も打てるようになるし、文字コードはふつう16進で書かれるものなのでそのまま打てて便利である。



    さてしかし「R」だけ打てても日本人は困る。「らりるれろ」を入力したい。
    そんなときにはソフトウェアキーボードだ。
    IMEパッドのソフトキーボードのかなモードを使って1文字づつ打つか、
    IMEパッドのソフトキーボード(かな)
    osk.exe「スクリーンキーボード」なら普通にR,Aと打って「ら」を入力することができる。
    スクリーンキーボード
    Windows+R…が使えないのでマウス操作で、名前を指定して実行から「osk」を実行。
    O,S,Kが使えない時はマウス操作でなんとかしよう。
    Windows8以降なら「タッチキーボード」も同様に使える。
    タッチキーボードのアイコン
    タッチキーボード
    (それにしてもWindowsにはソフトウェアキーボードが多いな…)



    さて何度も打ちたいときはこれではまどろっこしい。やはり物理キーボードを使いたい。
    それならばMS-IMEのローマ字設定を変えよう。
    使っていない例えばQやXあたりをラ行にあてればよいだろう。
    (なおMacのことえりではデフォルトでLがラ行を打つのに使えたように思う。)
    MS-IMEでローマ字の追加
    ここでちょっとしたおまけで、例えば「QYA」で「りゃ」が打てる状態で、QYAで打った「りゃ」を1文字消して「り」になったものをF10で変換すると「RI」になってくれるので、Rキーを使わず「R」の文字を出すこともできる。

    MS-IMEを使う方法は日本語入力時はよいが、IMEをオフの状態で入力しなければならない場合に困る。
    面倒だがレジストリをいじってキー配置を変更するのが最終手段である。
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Keyboard Layoutにバイナリ値「Scancode Map」を作成し以下のようなフォーマットで書く。
    dword 0;
    dword 0;
    dword length+1;
    {
        word scancode_out;
        word scancode_in;
    } * length
    dword 0;
    めったに使わない無変換やF1など適当なキーをRとして使うようにするとよいだろう。
    例えばF1をRにするなら、F1のスキャンコードが0x3B、Rは0x13であるから、
    00 00 00 00 00 00 00 00
    02 00 00 00 13 00 3B 00
    00 00 00 00
    こうなる。
    スキャンコードの表は検索すれば見つかるだろう。例えばここ
    なお注意点として、PS/2キーボードから送出されるスキャンコードとWindowsが内部的にScancode Mapに使っているスキャンコードは別物なので、「Scancode Mapに設定するための」スキャンコード表を探そう。
    また、1ユーザーのみの設定がHKEY_CURRENT_USER\Keyboard Layout\Scancode Mapで昔はできたのだが7以降できなくなっただか環境によってできないだかという。実際Windows8.1で試してできなかった。
    昔WindowsXPで1ユーザーのみの設定をした時の記事も参考になるかもしれない。
    http://wentwayup.tamaliver.jp/e50134.html

    以上、突然Rが反応しなくなった時にはぜひ試してみてほしい。  

  • ARMマイコンはじめました。
    2016年05月28日 14:43

    はじめました。2013年6月頃に。なぜ今頃書くかというと、9割書き上げて放置されていたのを今発掘したためだ。

    その頃、LPC810というARMマイコンがでた。
    8ピンDIPなのでブレッドボードに直接挿せるという。

    これが秋葉原のマルツに入荷したというので早速買いに行った。

    売り切れだった。

    しかし上位種のLPC812は残っていたのでこれを買ってきた。
    LPC812はピン数やメモリ容量、周辺機能といった全ての面でLPC810を上回っており、値段もあまり変わらない。今見ると25円差。当時もたぶんそれくらいだったと思う。
    ただ1つだけ重大な欠点があり、パッケージがDIPではなくSOPで扱いづらい。
    ハーフピッチのユニバーサル基板でピッチ変換してみたが、後悔した。めっちゃめんどい。
    LPC812をハーフピッチ基盤にハンダ付け
    秋月でちょうどいい変換基板が80円で売られているのでお勧めだ。

    さてこの石はPICやAVRと違って専用の書き込み機が必要ないので出費が少なくて嬉しい。

    書き込み用の接続は開発環境が無くても試せるのでまずこれを試す。

    用意する物はシリアルポートと7404(NOT)か何かとあと抵抗。
    自分はこんなこともあろうかとシリアルポート付きのPCを買っているが、きっとUSB-シリアル変換ケーブルでも大丈夫だと思う。
    7404は要するに論理を反転できればいいので7400(NAND)とか7402(NOR)でもよい。自分が使ったのもNANDだ。
    シリアルポートとの接続はこのページを参考に直結した。
    軽く説明すると、シリアルポートの受信側インピーダンスは3kΩ~7kΩらしいのでそのための4.7kΩと、電圧が高いので電流を落とすための100kΩである。

    この回路をLPC812のUSART0ポートに接続、そしてブートローダーを立ち上げるためにPIO0_1をGNDに落とす。
    以上で準備は完了。
    LPC812 をシリアルポート接続
    電源を繋ぎ、適当なターミナルソフトからデータ8bit、パリティなし、ストップ1bit、速度任意の設定で「?」の1文字を送信する。
    成功すれば「Synchronized<改行>」が表示されるはずだ。
    LPC812_Symchronized

    接続に成功したので次は開発環境のLPCXpressoIDEをいれる。登録とか要るのでまあ適宜なんとかする。
    さらに書き込みソフトのFlashMagicをいれる。

    IDEを立ち上げる
    左下に「Quickstart Panel」があり、その中の「Start here」の中に「Import project(s)」
    Examplesフォルダが開いてるのでその下から
    \NXP\LPC800\NXP_LPC8xx_SampleCodeBundle.zip
    のようなものを探してあとは適当に全部入れる。
    Project Explorerを見ると色々入っている。BlinkyというモノがLEDを点滅させてくれそうだ。してみるとこれだけ入れればよかったか。まあいいや。
    Blinkyを選んだ状態でメニューからProject→Build Projectを選択。
    すると何やら動きだし、デバッグビルドができたようだ。リリースビルドの方が良かったかと切り替えてみたら何やらエラーが出た。まあデバッグで困ることもないしいいや。
    さてビルドができたのでFlashMagicから書き込もうとしてみるが、できたファイルはaxfで書き込むためのファイルはhexのようだ。
    調べてみるとどうやらaxfファイルはIDEから直接書き込んでデバッグとかするためのファイルのようで、hexファイルを出力するにはaxfから変換する必要があるようだ。めんどい。
    http://support.code-red-tech.com/CodeRedWiki/OutputFormatsを参考に
    下のバーの右手側にあるというプロジェクト名を探したら左側にあったが、気にせずCtrlクリック。
    intel形式のhexファイルにしたいので
    arm-none-eabi-objcopy -O ihex blinky.axf blinky.hex
    を実行。失敗。ファイルが無いと言われる。
    パスが違ってた。こうだな
    arm-none-eabi-objcopy -O ihex debug/blinky.axf blinky.hex
    今度は成功。思っていたところの1階層上に出力されたがまあいいや。

    あとはFlashMagicで適に設定して書き込み。これは難なく成功した。
    FlashMagicでLPC812に書き込み

    ブートローダー設定用のGNDに落としたピンを外して電源を入れると
    …動いた!
    LPC812_blinky
    3つのLEDが順番に消灯する。多分順番に点灯するべきなので、+-を間違っているようだがまあいいや。

    その後TVにカラー出力など試していた
    LPC812でNTSCカラー
    が、命令プリフェッチの関係かクロック数がどう数えても合わないので力尽きた。
    より困難な(プリフェッチ幅が広く、I/O命令が遅い)LPC1114でNTSCカラー出力を実現したPancake(IchigoJam周辺機器)はすごいと思う。尊敬する。  

  • SDカードから1セクタ読み取るまでの手順解説
    2015年10月05日 01:09

    数年前からマイコンでSDカードを読みたいと思い続けていたが、やっと実行に移した。(そしてそれをブログに書くまでに1ヶ月…)
    使うマイコンはもちろん慣れ親しんだPIC。中でも最近一番のお気に入りの10F200…といきたかったのだが多少無理があったので12F510に。
    10F20012F510
    Flash256ワード1024ワード
    RAM16バイト38バイト
    I/Oピン4本6本
    主に問題なのはI/Oピン数。SDの操作に4ピン使うので、10F200では他にピンが余らない。またFlash容量も心許ない。読み取りだけならなんとかなるにしてもデバッグ用に出力などする余裕が全くないだろう。

    回路はこちら。単純につないだだけ。
    回路写真
    現在、第0セクタ512バイトを読んだところである。
    SDカード_1セクタ読み出し
    次はファイルシステムを解釈してファイルの読み書きをしようと思っているが、その前に今回得た知見をブログにまとめておくことにする。



    まず参考資料。

    1. https://www.sdcard.org/downloads/pls/simplified_specs/
    数年前からSDカードの仕様は公開されている。完全な仕様書ではなく「Simplified」ではあるものの、れっきとした公式資料。
    これが公開される前はマルチメディアカード(MMC)としてのコマンドで扱うしかなかった。SPIモード部分についてはMMCとSDは互換性があるのでそれでも扱えるのだが、4ピンを使う高速なSDカード本来のプロトコルは使えない。
    この仕様書の公開によってついにSDカード本来のプロトコルが使えるように…なったかと思いきや実は足りない部分があってMMCの仕様書を見て埋めないといけないとも聞く。
    まあとりあえず今のところSPIモードしか使うつもりはないので困らない。

    2. MMC/SDCの使いかた
    ChaNさんのサイト。日本語のサイトの中ではもっとも詳しく説明されていると思う。何度見たか分からない。

    この2つの資料で分からない事はそのたびに適当に検索して調べていたのでどのサイトを見たかあまり覚えていない。
    思い出せるところでこのへんか。
    http://bluefish.orz.hm/sdoc/psoc_mmc.html
    http://bitcraft.web.fc2.com/embedded/microchip/microchip.html



    次にSDから1セクタ読むまでの手順…の前に色々解説。

    SDのSPIモードでの操作は、(当たり前ではあるが)すべてSPIのプロトコルに則った通信で行われる。つまりすべての通信は1バイト単位で行われる。
    そしてすべての通信は機器側がマスター、SDカードがスレーブで行われる。つまりSDカードが自発的にデータを送ってくることはなく、常にマスターがクロックを送ることでデータを読みだすことになる。
    なおSPIは全二重の通信ができる規格だが、SDカードの操作では大抵どちらかがデータを出すときはもう一方はデータを出さない(0xFFを出す)。両方がデータを出しているのはデータパケットの受信を止める時くらいか。
    SDモードでは1本のデータ線で半二重通信をするのでそれと合わせたのかもしれない。あるいはそもそも必要ないしそっちの方が楽ということかもしれない。
    SPIモードに入ってからの通信はすべてコマンドを送信して返答を読み取るトランザクション単位で行われる。
    そしてトランザクションはパケット単位で行われる。1つのトランザクションの流れは次のようになる。
    ・コマンド送信
    ・レスポンス受信
    ・(あれば)データ送信or受信
    なおコマンド送信後すぐにレスポンスが読み取れるとは限らない。0xFFが読めた場合それを読み飛ばす必要がある。
    1つのトランザクションが終わった後には1バイト以上のクロックを送信しなければならないという奇妙な仕様がある。
    マスターはクロックをいつでも中断できる(ACMD41の最中を除く)。

    コマンドは、6バイト固定で次のような構造をしている。
    ・1バイトのコマンド番号
     うち頭2bitはスタートビットと、通信方向を示すTransmission Bit
    ・4バイトの引数
    ・1バイトのCRC
     うち末尾1bitはEnd Bit(って書いてあるけどストップビットって名前のほうが馴染みがある)
    1バイト単位なのにスタート・ストップビットがあるという奇妙な構造だが、1bit単位で通信を行うSDモードと共通化したためであろう。通信方向を示すのもSPIモードでは送受信に別の線が割り当てられているしCSもあるのだから不要である。
    CRCはSPIモードでは基本的にはチェックされないため適当な値を入れればよいが、そうでないところもあり要注意だ。
    レスポンスには以下の種類がある。
    ・R1: 1バイトで、単純な状態を返す。
    ・R1b: R1の後にビジー応答(連続したLowレベル)を返す。
    ・R2: 2バイトで、R1に加え詳細なエラー状態を返す。
    ・R3/R7: R1に加え4バイトの情報を返す。
    ・R4/R5: SDIOのための予約らしい。
    ・R6: どうやらSDモード専用のようだ。
    データパケットは、任意バイト数のデータを1バイトのヘッダと2バイトのCRCで挟んだ構造である。
    コマンドと異なりデータパケットのヘッダは先頭bitが0ではない。こちらはSPIモード専用なので1バイト単位で読む前提のようだ。



    改めて、SDから1セクタ読むまでの手順。

    ・コマンド送信前の儀式
    まずSDカードの電源を投入してから1ms待ち、74個以上のクロックを送ることでコマンドを受け付ける準備が完了する。
    74とは中途半端だが、この時点ではSDモードなのでクロック数が8の倍数である必要がないためだ。もっともSPIで制御するなら切りよく80クロック送るのが楽だろう。

    これ以下はSPIモードと考えて良い。

    ・CMD0 リセット
    このコマンドは本来の機能の他にSPIモードへの切り替え機能を持っており、CSをLowにした状態で送ることでSDカードをSPIモードにすることができる。このコマンドを送信する時点ではSPIモードではないのだが、コマンド送信についてはSDモードとSPIモードでほぼ同じ形式なのでSPIモードのつもりで問題ない。
    SDモードで使うときにはCSをHighでこのコマンドを送ることで、SPIモードのレスポンスとは違う何かが起こる(よく知らない)。
    引数は任意と書かれているところと0固定と書かれているところがあってよく分からない。たぶん任意だと思うが、まああえて0以外を送る理由もない。
    SPIモードでないためCRC必須。引数が0の場合CRCは0x95である(ストップビット含む)。
    返答はidleフラグのみの立った「0x01」であるはずである。

    ・CMD8 インターフェースコンディション確認
    引数は、0x000001XX。
    XXは任意。0xAAが推奨されているが、私は0xABをおすすめする。これにすると、CRCの値をCMD0と同じにすることができる。
    仕様書にはSPIモードでもCRC必須とある。
    ネット上の情報では「CMD0のみCRC必須」と書かれているものがあるが、どうもCMD8はSDカードのver.2からできたコマンドのようで、それ以前はCMD0のみがCRC必須のコマンドだったせいで混乱しているように見える。
    このコマンドは対応している電圧範囲を取得するコマンドであり、レスポンスはR7で引数に指定された電圧範囲に対応しているかと、上で「任意」と書いたチェックパターンがそのまま返ってくる。
    ただ、これは全電圧範囲に対応しているか否かを調べるだけで、普通は対応しているし、対応していなかったらどうしようもないので、調べる意味はあまりない。
    が、これを送ることでSDHC/SDXCはCMD58とCMD41を有効化するということなので、送信は必須のようだ。
    なおこれはver2以降のカードの場合であり、それより前のカードでは不正コマンドとなり、返答はR1で「0x05」となる。つまりver2以降か否かを調べるという効果もある。
    1バイトしか返答がないところ5バイト読むと、残りはデータ線がHighのままなので0xFFが読める(害はない)。

    ・CMD1またはACMD41 初期化
    初期化コマンドは仕様書を読む限り、「CMD1を使うとMMCとSDの区別がつかないので非推奨」と読めるのだが、手元のいくつかのカードで試してみたところ、CMD1を受け付けないカードがいくつかあった。ACMD41を使わなければならないのだろうか。しかしそれではSDのSimplified仕様書が公開される前にMMCとして扱えていたという情報と矛盾するように思う。
    なんにせよ今回使ったSDはCMD1に反応したので今回のコードではCMD1のままである。
    CMD1は引数任意でレスポンスはR1。初期化が完了するまではidleを示す0x01、完了したらエラー無しの0x00が返る。
    ACMD41の引数はホストのSDHC/XCサポートの有無を示すHCSの1bitのみ(他のbitは予約)、応答はR3でOCRレジスタの内容が返る。
    idleでなくなるまでCMD1またはACMD41を送り続ける。

    ・CMD58 OCRレジスタ読み取り
    レスポンスはR3で、32bitのOperation Conditions Registerの値を読み取る。内容は対応している電圧範囲、SDHC/SDXCか否かを示すbit、ビジーフラグ。電圧範囲はCMD8でも確認してこちらでも確認するのだろうか。よく分からない仕様だ。
    なお今書いていて気づいたのだが、このコマンドはSDカードでは予約扱いになっており、OCR読み取りにはACMD41を使う前提のようだ。しかし使ったカードではきちんとレスポンスを返してくれた。よく分からない。

    ・CMD9 CSDレジスタ読み取り
    Card-Specific Dataレジスタの値を読み取る。カードの容量など様々な情報が含まれている。
    このレジスタはOCRレジスタと異なり16バイトあるためレスポンスの中身ではなくデータパケットとして送られてくる。
    なお今回のコードではこの内容は読むだけで使っていない。

    ・CMD16 ブロックサイズ指定
    SDHC/SDXCではこのコマンドは無視され512バイト固定だが、SDの一部でデフォルトが512バイトでない場合がありうるので必要らしい。
    面倒なので今回のコードでは省略した。

    ・CMD17 1ブロック読み取り
    このコマンドでカード本体の内容を読める。
    引数は読み取り開始アドレス。
    無印SDカードは1バイト単位、SDHCおよびSDXCはセクタ(512バイト)単位で指定する。
    1ブロック分のデータパケットが得られる。



    以下自分の悩んだ点をまとめておく

    ・CSの操作
    1回のトランザクションごとにCSをHighに戻す。
    つまり、CSをLowにアサート、コマンド送信、レスポンス受信、(データパケットがあれば送受信、)CSをHighに。
    CSの動作として当たり前なのだろうが、これが確信が持てなくてだいぶ悩んだ。

    ・ダミークロック
    トランザクションごとに1バイト分のダミークロックが必要。
    ダミークロックについては仕様書の(SPIモードでなく)SDモードの部分に書いてある。
    CSはHighでもLowでも構わないと書いてあるサイトがあった。とりあえずHighにしている。

    ・ACMDの処理
    CMD55,CMDnのシークエンスをACMDnという。
    それはいいのだが、CMD55と次のコマンドの間の処理がよくわからなかった。
    CMD55を送って返答の1バイトが返ってくるまでで1トランザクション、ここでダミークロックまで送り、次のコマンド本体とその返答がまた1トランザクションということのようだ。

    ・クロック周波数
    初期化中のクロック周波数は100kHz~400kHzと書かれているが、仕様書を読むともっと詳しく書かれている。
    ACMD41を発行しカードの初期化が完了するまで、ホストは次の2つのうちどちらかを行わなければならない。
    1) 周波数100kHz~400kHzの連続的なクロックを出力する
    2) ホストがクロックを停止したいならば、50ms以内の間隔でACMD41によりビジービットをポーリングする
    マイコンでSPIモードを使うならふつうクロックは断続的になるだろうから見るべきは2番の方である。
    ところで50ms以内の間隔ならクロックは100kHzを下回ってもよいのだろうか。
    よいならば最低クロックはACMD41とレスポンスで50msになる値、レスポンスが即時に返ってくるとして6+1+6+5=18バイト分なので、(18*8)/0.05=2880Hzということに…
    なるかと思いきや、よく図を見るとトランザクション中の時間は50msに含まれていない。
    SD仕様書_クロックの制限
    するとクロックが50ms以上止まらなければよいのだろうか。であれば1/(50ms*2)=10Hz…?
    これはちょっと実験してみたいところだ。
    なお、ACMD41を除いてクロックは好きな時に停止してよいようだ。これは助かる。

    ・CRC
    分からない。
    色々な所を見たが、見る所ごとに書いてあることが違う(ように感じる)。
    結局、ここのコードを中身を理解しないままJavaScriptに移植して使ったところ、思ったのと1bit違うところで答えが出たのでそのまま使った。
    http://nabe.blog.abk.nu/0355

    ・自分のプログラムのバグ
    他人の役に立つとは思えないが、面白いバグだったので書き留めておく。
    起こった現象
    初期化シーケンスに対する返答が順に以下のようであった。
    CMD0に0x01が返る。idleフラグのみ立った状態であり、これは正しい。
    CMD8に0x00FFFFFFFFが返る。つまり1バイト目はエラー無しを示しているのにその後に続くはずのデータが来ない。古いSDでCMD8に非対応だからだろうか。
    CMD1に常に1回で0x00が返る。idle待ちがあるはずだが…まあきっと通信が遅いせいだろう。たぶんおかしくない。
    CMD58に0x00FFFFFFFFが返る。つまりCMD8と同様エラー無しなのにデータが無い。

    別のカードを使ってみると違う結果が返るものがあり、
    CMD8に0x00000001AAが返るものがある。idleでないのが不可解だがデータは正しい。
    CMD58に0x0080FF8000や0x0000FF80が返るものがある。これは正しい。

    さて困った。正しいデータが返るものもあるのだから、SPIやシリアル通信のプログラムが間違っているとも思えない。

    CMD58に返答が返るものを使えばとりあえず先に進めるのだからよく分からないがこれを使っておくか…
    …と思ったが、色々考えてみるとやはりCMD8に0x00が返ってくるのはおかしい。非対応ならエラーフラグの立った0x05が返るはずである。
    CMD1のidle待ちが無いのも不可解だ。いくら遅いとはいえ1ループ数ミリ秒で回しているのだが、このidle待ちは「数百msかかることがある」というもので、早くても数十msはかかるのではないか。

    つまり、頭の1バイトだけなぜか0x00に化けているのではないか。しかしそんな都合のいいバグが…あった。
    どういうバグかというと、
    ダミークロックを送る関数でバンク0に用意したループカウンタを回すつもりだがバンクを変えておらず、
    運良くシリアル送信との兼ね合いでバンク0にしていた1回目のCMD0を除き、みなバンク1の変数を回していた。
    そしてそこにちょうど読んだデータの1バイト目があったため、カウントダウンしてループを抜けるときには常に0になっていたというわけだ。
    ミッドレンジのPICならバンク切り替えの必要は無かったので、もっと余裕をもった石を使うべきだったかもしれない。(もっとも10F200でなく12F510にした時点で余裕をもったつもりだったのだが)



    最後にコード
    ページ0/1を両方使っているが、ページ1はメッセージだけなのでそれを除けば512バイトのPICにも収めることができる。まあそんなPICはほとんど無いのでできてどうするという話ではあるが。

    ・コード内訳
    000-1FF メインコード・サブルーチン
    200-2FF メッセージ
    300-3FF 未使用
    なおベースラインPICの仕様上ページの前半にしかCALLで飛べないため、サブルーチンの本体は後半に置きつつ前半に一度CALLしてからGOTOで本体に飛ばす構造になっている。


        list    p=12F510
        #include p12F510.inc
        radix dec

        ;    12F510
        ;      Vdd+-v-+Vss
        ;      GP5|   |GP0 DAT
        ;      GP4|   |GP1 CLK
        ;    (GP3)+---+GP2

        ;-    /--
        ;CS  |
        ;DI  |
        ;Vss |
        ;Vcc | 表
        ;SCL |
        ;Vss |
        ;CO  |
        ;-   +---

        variable env
    env=    _IOSCFS_ON
    env&=    _MCLRE_OFF
    env&=    _CP_OFF
    env&=    _WDT_OFF
    env&=    _IntRC_OSC
        __config env

        cblock 0x0A ;バンク共通
            bitcnt, bytecnt, skipcnt
            commdat, spioutbuf
        ;バンク0
            flag
            cnt0, cnt1, cnt2, cnt3
            temp, temp2
            arg0, arg1, arg2, arg3
            msgptr
        endc
        ;バンク1は読み取ったデータの保存領域

    ;ram alias

    ;bytecnt equ bytecnt

    ;flag bit
    RXFLAG  equ 0
    TIMEOUT equ 1

    MOSIPIN equ 0
    MISOPIN equ 3
    SCLKPIN equ 1
    CSPIN   equ 2
    RXPIN   equ 4
    TXPIN   equ 5
    MORSEPIN equ 5
    MOSIBIT equ 1&lt;&lt;MOSIPIN
    MISOBIT equ 1&lt;&lt;MISOPIN
    SCLKBIT equ 1&lt;&lt;SCLKPIN
    CSBIT   equ 1&lt;&lt;CSPIN
    RXBIT   equ 1&lt;&lt;RXPIN
    TXBIT   equ 1&lt;&lt;TXPIN

    CMD equ 0x40
    CRC_CMD08 equ 0x95
    ;CMD0: 40 00 00 00 00 と
    ;CMD8: 48 00 00 01 AB で兼用

    #define flagWAIT STATUS,GPWUF
    #define flagCMD8 STATUS,CWUF


    ;##### EntryPoint #####
        org 0x00
        goto init

    ;##### Subroutine Entry #####
    ;関数のcall先。ベースラインではページの前半しかcallできないためここにまとめてある。
    ;関数の本体はメインコードの後に置いてある。
    txmsg232:
        goto txmsg232core
    getmsgbyte: ;これのみページ1へ飛ばす
        bsf STATUS,PA0
        movwf PCL
    skipandread1: ;Wに1を入れてskipandreadn。すなわち1バイト読む
        movlw .1
    skipandreadn: ;0xFFのバイトを読み飛ばした後にNバイト読む
        bsf flagWAIT
    readn: ;Nバイト読む
        goto readncore
    skip2np1:
        goto skip2np1core
    skip2n:
        goto skip2ncore
    tx232hex:
        goto tx232hexcore
    ;readresponse1:
    ;    bsf respcnt,0
    ;readresponse:
    ;    goto readresponsecore
    sendnibble:
        goto sendnibblecore
    sendsdcmdarg0:
        goto sendsdcmdarg0core
    sendsdcmd:
        goto sendsdcmdcore
    ;morse8:
    ;    movwf dat
    ;    goto f1
    ;morse:
    ;    goto morsecore
    ;morsespace:
    ;    ;interword(7)-interchar(3) =4
    ;    movlw .8
    ;    goto waithalfdit

    readspi: ;SPIで0xFFを送信する
        movlw 0xFF
    spi:
        goto spicore
    tx232:
        bsf GPIO,TXPIN ;0
        bcf flag,RXFLAG
        movwf commdat
        goto tx232core
    rx232:
        btfss GPIO,RXPIN ;[0,3)
        goto rx232
        goto rx232core
    rx232withtimeout:
        bcf flag,TIMEOUT
    rx232waitloop:
        btfsc GPIO,RXPIN ;[0,5)
        goto rx232core
        incfsz cnt0,F
        goto rx232waitloop
        incf cnt1,F ;待ち時間を正しくカウントするために必要
        btfsc GPIO,RXPIN
        goto rx232core
        incfsz cnt1,F
        goto rx232waitloop
        incf cnt2,F ;
        btfsc GPIO,RXPIN
        goto rx232core
        incfsz cnt2,F
        goto rx232waitloop
        bsf flag,TIMEOUT
        retlw 0

    ;##### Main Code #####
    init
        movwf OSCCAL
       
        movlw b'10001000'
        ;       /GPWU
        ;        /GPPU=0: PullUp ON
        ;         T0CS=0: Fosc/4,
        ;          T0SE Don'tCare
        ;           PSA Don'tCare
        ;            PS2:0 Don'tCare
        option
       
        clrf ADCON0
        bcf CM1CON0,C1ON
       
        movlw MOSIBIT|CSBIT
        movwf GPIO
        movlw MISOBIT|RXBIT
        tris GPIO

        movlw 0x2A
        movwf FSR
    b12:
        clrf INDF
        bcf FSR,5
        clrf INDF
        bsf FSR,5
        incfsz FSR,F
        goto b12

    initsd: ;1ms待ってから74個以上のクロックを出力
        ;wait 1ms
        clrf cnt0
    b9:
        goto $+1
        goto $+1
        nop
        decfsz cnt0,F
        goto b9
       
        movlw .5 ;10byte&gt;74
        call skip2np1

    test:

    ;メッセージ出力
        movlw msg_cmd0
        call txmsg232

        bcf GPIO,CSPIN

    ;CMD0を引数0で送信
        movlw CMD|.0
        call sendsdcmdarg0
    ;受信しつつ応答が来るまでスキップし、応答を1バイト読む
        call skipandread1
    ;応答が来るまでにスキップした回数と受信内容を出力
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        movf INDF,W
        bcf FSR,5
        call tx232hex
    ;CSをHighに
        bsf GPIO,CSPIN
    ;1バイトダミークロック出力
        movlw .0
        call skip2np1

    ;CMD8で同様
        movlw msg_cmd8
        call txmsg232

        bcf GPIO,CSPIN
       
        movlw 0x01
        movwf arg2
        movlw 0xAB
        movwf arg3
        movlw CMD|.8
        call sendsdcmd
    ;CMD8の応答は5バイト
        movlw .5
        call skipandreadn
       
        bsf GPIO,CSPIN
       
        movlw .0
        call skip2np1
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
    ;5バイト出力。もうちょっとまともにやりたい。
        movlw 0x30
        movwf FSR
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
       
    ;CMD1。ACMD41を試してた名残りがある。
        movlw msg_cmd1
        call txmsg232
       
    b13:

    ;    movlw CMD|.55
    ;    call sendsdcmdarg0
    ;   
    ;    call skipandread1
    ;    bsf GPIO,CSPIN
    ;    movlw 0x30
    ;    movwf FSR
    ;    movf INDF,W
    ;    bcf FSR,5
    ;    call tx232hex
       
        bcf GPIO,CSPIN
        movlw CMD|.1
        call sendsdcmdarg0
       
        call skipandread1
        bsf GPIO,CSPIN
       
        movlw .0
        call skip2np1
       
        movlw '/'
        call tx232

        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        movf INDF,W
        bcf FSR,5
        movwf temp2
        call tx232hex
           
        movf temp2,W
        btfss STATUS,Z
        goto b13
    ;CMD58
        movlw msg_cmd58
        call txmsg232
       
        bcf GPIO,CSPIN
        movlw CMD|.58
        call sendsdcmdarg0
       
        movlw .5
        call skipandreadn
       
        bsf GPIO,CSPIN
       
        movlw .0
        call skip2np1
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
    ;CMD9
        movlw msg_cmd9
        call txmsg232
       
        bcf GPIO,CSPIN
        movlw CMD|.9
        call sendsdcmdarg0
        call skipandread1
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
       
        movlw .16
        call skipandreadn
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
    b18:
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        movf FSR,W
        andlw 0x1F
        btfss STATUS,Z   
        goto b18
       
        movlw .3
        call readn
       
        movlw 0x30
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
       
        bsf GPIO,CSPIN
       
        movlw .0
        call skip2np1
       
    ;---
    ;CMD17
        movlw msg_cmd17
        call txmsg232
       
        bcf GPIO,CSPIN
        movlw CMD|.17
        call sendsdcmdarg0
        call skipandread1
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
       
        movlw '/'
        call tx232
       
        call skipandread1
       
        decf skipcnt,W
        call tx232hex
        movlw ','
        call tx232
       
        movlw 0x30
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex

    ;512バイトを16バイトごとに受信して表示
        movlw .512/.16
        movwf cnt0
    b17:
        movlw msg_nl
        call txmsg232
       
        movlw .16
        call skipandreadn
       
        movlw 0x30
    b16:
        movwf FSR
        bsf FSR,5
        movf INDF,W
        bcf FSR,5
        call tx232hex
        incf FSR,F
        movf FSR,W
        andlw 0x1F
        btfss STATUS,Z   
        goto b16
       
        bcf FSR,5
        decfsz cnt0,F
        goto b17
           
        goto $

    busychk: ;あれ、なんでこんなところに置いてあるんだろう。ページ前半でないとcallできない。
        goto busychkcore

    ;##### Subroutine Core #####
    busychkcore: ;ビジーチェック…のはずだけどどうやら使っていない。
        call readspi
        movf commdat,W
        btfsc STATUS,Z
        goto busychkcore
        retlw 0

    readncore: ;Nバイト読み取り
        movwf bytecnt
        movlw 0x30
        movwf FSR
        clrf skipcnt
    readloop:
        call readspi
        btfss flagWAIT
        goto f2
        incf skipcnt,F
        incf commdat,W
        btfsc STATUS,Z
        goto readloop
        bcf flagWAIT
    f2:
        movf commdat,W
        movwf INDF
        incf FSR,F
        decfsz bytecnt,F
        goto readloop
        bcf FSR,5
        retlw 0

    sendsdcmdarg0core: ;SDのコマンドを引数を0にして送信
        clrf arg0
        clrf arg1
        clrf arg2
        clrf arg3
    sendsdcmdcore: ;SDのコマンドを送信
        call spi
        movf arg0,W
        call spi
        movf arg1,W
        call spi
        movf arg2,W
        call spi
        movf arg3,W
        call spi
        movlw CRC_CMD08
        call spi
        retlw 0

    skip2np1core: ;2N+1バイト分のダミークロックを出力
        bsf bitcnt,3
    b14:
        bsf GPIO,SCLKPIN
        goto $+1
        bcf GPIO,SCLKPIN
        decfsz bitcnt,F
        goto b14
    skip2ncore: ;2Nバイト分のダミークロックを出力
        movwf bytecnt
        movf bytecnt,W
        btfsc STATUS,Z
        retlw 0
    b11:
        bsf bitcnt,3
    b10:
        bsf GPIO,SCLKPIN
        goto $+1
        bcf GPIO,SCLKPIN
        goto $+1
        bsf GPIO,SCLKPIN
        goto $+1
        bcf GPIO,SCLKPIN
        decfsz bitcnt,F
        goto b10
        decfsz bytecnt,F
        goto b11
        retlw 0

    spicore: ;SPI 1バイト送受信
        movwf commdat
        rrf GPIO,W
        andlw ~(0x80|SCLKBIT&gt;&gt;1|CSBIT&gt;&gt;1|MISOBIT&gt;&gt;1)
        movwf spioutbuf
    ;    bcf GPIO,CSPIN
       
        bcf STATUS,C
        bsf bitcnt,3
    spiloop:
        rlf commdat,F
        rlf spioutbuf,W ;CS:L SCLK:L MOSI&lt;-C / c0
        movwf GPIO
        goto $+1
        bsf GPIO,SCLKPIN
        btfsc GPIO,MISOPIN
        bsf commdat,0
        decfsz bitcnt,F
        goto spiloop
       
        bcf GPIO,SCLKPIN
       
        retlw 0

    ;### RS232C
    ;RS232Cシリアル関連のコード。

    txmsg232core: ;文字列を送信
        movwf msgptr
    msgloop:
        call getmsgbyte
        bcf STATUS,PA0
        movwf temp
        andlw 0x7F
        call tx232
        btfsc temp,7
        retlw 0
        incf msgptr,F
        movf msgptr,W
        goto msgloop
        retlw 0

    tx232hexcore: ;1バイトを16進表記で送信
        movwf temp
        swapf temp,W
        call sendnibble
        movf temp,W
        call sendnibble
        retlw 0
       
    sendnibblecore: ;下位ニブルを送信
        andlw 0x0F
        movwf commdat
        movlw .6
        addwf commdat,F
        movlw '0'-.6
        btfsc STATUS,DC
        movlw 'A'-.10-.6
        bsf GPIO,TXPIN ;0
        bcf flag,RXFLAG
        addwf commdat,F
        goto tx232core

    rx232core: ;1バイト受信。使っていない。
        bsf flag,RXFLAG ;[4,7) mean5.5
        movlw 0xFF
        movwf commdat
        goto $+1
    ;    btfsc flag,BAUD300
    ;    goto wait0r5a
    ;waitend0r5a:
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        goto $+1

    ;tx232:
    ;    bsf GPIO,TXPIN ;0
    ;    bcf flag,RXFLAG
    ;    movwf commdat
    ;    goto tx232core
    tx232core: ;1バイト送信
        nop ;5
        bsf bitcnt,3

    loop232:
        goto $+1
    ;    btfsc flag,BAUD300 ;ボーレートを115200と300で選べるようにしようと思ったが結局115200固定に。
    ;    goto wait1b
    ;waitend1b:
        goto $+1
        nop
        bcf STATUS,C
        btfss GPIO,RXPIN ;read 28.5 +17n
        bsf STATUS,C
        rrf commdat,F
        movf GPIO,W
        andlw ~TXBIT
        btfss STATUS,C
        iorlw TXBIT
        movwf GPIO ;send 20 +17n
       
        decfsz bitcnt,F
        goto loop232
       
    ;    btfsc flag,BAUD300
    ;    goto wait1c
    ;waitend1c:
        ;連続受信を極力早くするためここでreturn(2命令挟んで次のcallでストップビット中央)
        btfsc flag,RXFLAG
        retlw 0

        goto $+1
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        goto $+1
       
        bcf GPIO,TXPIN ;send stop +17
        goto $+1
    ;    btfsc flag,BAUD300
    ;    goto wait1d
    ;waitend1d:
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        nop
        ;連続送信で安全な時間空ける(1命令挟んで次のcallでストップビットが17サイクル)
        retlw 0

    ;### morse
    ;デバッグ出力用にモールス信号を出力するコードを書いたが結局使わなかった。

    ;morsecore:
    ;    movwf dat
    ;b3:
    ;    decf cnt0,F
    ;    rlf dat,F
    ;    btfss STATUS,C
    ;    goto b3
    ;f1:
    ;    movlw .8
    ;    addwf cnt0,F
    ;
    ;b4:
    ;    ;bcf GPIO,OUTPIN
    ;    rlf dat,F
    ;    movlw .6 ;dah
    ;    btfss STATUS,C
    ;    movlw .2 ;dit
    ;    movwf cnt2
    ;
    ;b5: ;2MHz,4*256cyc: ~1kHz
    ;    movlw 1&lt;&lt;MORSEPIN
    ;    decfsz cnt3,F
    ;    goto b5
    ;    xorwf GPIO,F
    ;    decfsz cnt1,F
    ;    goto b5
    ;    decfsz cnt2,F
    ;    goto b5
    ;
    ;;bsf GPIO,OUTPIN
    ;
    ;;1点間隔
    ;    movlw .2
    ;    movwf cnt3
    ;b7:
    ;    ;4cyc,2MHz: .13sec
    ;    nop
    ;    decfsz cnt1,F
    ;    goto b7
    ;    decfsz cnt2,F
    ;    goto b7
    ;    decfsz cnt3,F
    ;    goto b7
    ;
    ;    decfsz cnt0,F
    ;    goto b4
    ;
    ;;interchar(3)-interelem(1) =2
    ;    movlw .4
    ;;    goto waithalfdit
    ;
    ;waithalfdit:
    ;    movwf cnt3
    ;b6:
    ;    ;4cyc,2MHz: .13sec
    ;    nop
    ;    decfsz cnt0,F
    ;    goto b6
    ;    decfsz cnt2,F
    ;    goto b6
    ;    decfsz cnt3,F
    ;    goto b6
    ;    retlw 0

    ;メッセージ。最上位bitを立てることで終端を示している。ASCIIしか使えないが、\0終端と比べ1メッセージあたり1バイト節約できるのが利点。
    ;GBのアセンブラにあった機能を真似してみた。
        org 0x200
    msg_cmd0:
        dt "\r\nCMD0 reset&SPI mode\r", '\n'|0x80
    msg_cmd8:
        dt "\r\nCMD8 &gt;ver.2?\r", '\n'|0x80
    msg_cmd1:
        dt "\r\nCMD1 initialize\r", '\n'|0x80
    msg_cmd58:
        dt "\r\nCMD58 read OCR register\r", '\n'|0x80
    msg_cmd9:
        dt "\r\nCMD9 read CSD register\r", '\n'|0x80
    msg_cmd17:
        dt "\r\nCMD17 read single block\r", '\n'|0x80
    msg_nl:
        dt "\r", '\n'|0x80
        end
      

  • JavaScriptで生成した波形をHTML5のaudioで再生
    2015年09月30日 00:02


    タイトルの通り。
    前々からやりたいと思っていたがやっとできた。
    FirefoxとChromeで動作確認。IEはwavに非対応らしい。なんでじゃ。

    //ArrayBufferを生成
    var arrbuf = new ArrayBuffer(44100*2*5+44); //44.1kHz、2チャンネル、5秒、8bit +ヘッダ分
    //ArrayBufferをUint8で扱う。せっかくなのでクランプ。
    var uint8arr = new Uint8ClampedArray(arrbuf);
    //wavヘッダ。各種データは決め打ち。
    var head = [
        0x52, 0x49, 0x46, 0x46, 0xC8, 0xBA, 0x06, 0, 0x57, 0x41, 0x56, 0x45, 0x66, 0x6D, 0x74, 0x20,
        0x10, 0, 0, 0, 0x01, 0, 0x02, 0, 0x44, 0xAC, 0x00, 0x00, 0x88, 0x58, 0x01, 0x00,
        0x02, 0, 0x08, 0, 0x64, 0x61, 0x74, 0x61, 0xA8, 0xBA, 0x06, 0
        ];

    var i=0;
    for( ; i<head.length; i++)
    {
        uint8arr[i] = head[i]; //ヘッダをArrayBufferに入れる
    }
    for( ; i<uint8arr.length; i++)
    {
        uint8arr[i] = (i%256-128)/3+128; //波形データ生成。鋸歯波。3で割ってるのはボリューム100%だとうるさいから。
    }

    var blob = new Blob([arrbuf]); //ArrayBufferをBlobに

    var bloburl = window.URL.createObjectURL( blob ); //BlobのURLを生成

    document.getElementById("aud").src = bloburl; //URLをaudioのsrcに入れる
    15/10/03 修正
    (i%256)/3+128 → (i%256-128)/3+128
    直流分出ちゃってました。


    参考文献:
    ArrayBufferとBlob
    http://hakuhin.jp/js/array_buffer.html
    http://hakuhin.jp/js/blob_url_scheme.html
    WAV
    http://www.web-sky.org/program/other/wave.php
      

  • Excelで浮動小数点数のビットパターン表示
    2015年06月07日 20:51

    Excel関数で浮動小数点数のビットパターンと数値の相互変換を組んでみた。
    とりあえず単精度だけ。
    Excelで浮動小数点数変換
    4b3c614e
    =INT(HEX2DEC(LEFT(A1))/8)
    =MOD(INT(HEX2DEC(LEFT(A1,3))/8),256)-127
    =MOD(HEX2DEC(RIGHT(A1,6)),2^23)
    =(A4+2^23)*2^(A3-23)*-1^A2
    =A4*2^(-126-23)*(-1^A2)
    =IF(A4=0,IF(A2=1,"-∞","∞"),"NaN")
    =IF(A3=128,A7,IF(A3=-127,IF(AND(A2=1,A6=0),"-0",A6),A5))
    12345678
    =IF(A9<0,1,0)
    =INT(LOG(ABS(A9),2))
    =ABS(A9)/2^(A11-23)-2^23
    =ABS(A9)/2^(-126-23)
    =IF(A9=0,0,IF(A11>(-127),A12,A13)+(MAX(A11,-127)+127)*2^23+A10*2^31)
    =DEC2HEX(A14,8)
    =IF(A9="-0","80000000",IF(A9="∞","7F800000",IF(A9="-∞","FF800000",IF(A9="NaN","7F800001",A15))))

    使い方

    上の式をコピーして、ExcelのA1セルに1行目が合うように貼り付ける。
    Excelを持ってない人はLibreOfficeのCalcとかGoogleSpreadSheetとかGnumericとかお好きな表計算ソフトで。Excel固有の機能は特に使っていないのでどれでも動いた。
    でもOpenOfficeのcalcは関数の区切りが","じゃなく";"だからそのままだと動かない。","を全部";"に置換すれば動いたけど面倒なのでおすすめしない。
    あとGnumericもそのまま貼り付けたらテキスト扱いになっちゃっていちいち先頭の「'」を消さないといけなかったのでおすすめしない。
    他に表計算ソフトって何かあったっけ。KingSoftOfficeは試していないけどMSOfficeとの互換性を売りにしてるし大丈夫だろう。
    そういえばEeePC買った時にKingSoftOfficeのライセンスついてきたんだよな…。なんか結局使わずじまいだったなあ。
    あとは…「ThinkFreeてがるOffice」ってなんか急に思い出したぞ。
    …話がそれた。
    貼り付けたら、A1セルに単精度浮動小数点数のビットパターンを16進8桁で入力するとA8セルに対応する数値が出る。
    逆に、A9セルに数値を入れるとビットパターンがA16セルに出る。

    入力は大文字小文字問わず。
    出力はExcelで数値として扱えるものは数値で出力。
    数値として扱えない-0、±無限大、NaNは文字で出力。
    NaNのビットパターンは複数あるが、区別せず「NaN」と出力。

    入力は数値として扱えるものは数値で、そうでないものは文字列で。
    出力の16進数は大文字。NaNはどれが一般的なのか分からなかったので一番小さい7F800001にしてみた。

    解説

    それぞれの式で何をしているかを説明する。
    =INT(HEX2DEC(LEFT(A1))/8)符号部を取り出す
    =MOD(INT(HEX2DEC(LEFT(A1,3))/8),256)-127指数部を取り出し、ゲタ分を補正
    =MOD(HEX2DEC(RIGHT(A1,6)),2^23)仮数部を取り出す(ケチ表現はそのまま)
    =(A4+2^23)*2^(A3-23)*-1^A2正規化数だった場合の値を符号部と(ケチ表現を補正した)仮数部から計算 ※
    =A4*2^(-126-23)*(-1^A2)非正規化数(および0)だった場合の値を符号部と仮数部から計算
    =IF(A4=0,IF(A2=1,"-∞","∞"),"NaN")無限大orNaNだった場合の値を符号部と仮数部から計算
    =IF(A3=128,A7,IF(A3=-127,IF(AND(A2=1,A6=0),"-0",A6),A5))指数部を見て上3つから適切なものを選択
    ※特殊値を扱わないなら4行目までだけでOK

    =IF(A9<0,1,0)符号部を生成
    =INT(LOG(ABS(A9),2))指数部を生成
    =ABS(A9)/2^(A11-23)-2^23正規化数だった場合の仮数部を生成
    =ABS(A9)/2^(-126-23)非正規化数(および0)だった場合の仮数部を生成
    =IF(A9=0,0,IF(A11>(-127),A12,A13)+(MAX(A11,-127)+127)*2^23+A10*2^31)正規化数と非正規化数を場合分けしてまとめる
    =DEC2HEX(A14,8)16進数変換
    =IF(A9="-0","80000000",IF(A9="∞","7F800000",IF(A9="-∞","FF800000",IF(A9="NaN","7F800001",A15))))-0、±無限大、NaNの場合、直書きの文字列を出力。それ以外は上を出力

    おまけ

    JavaScriptで組んだら一瞬だった。TypedArrayって便利だね。
    そもそもJavaScript自体便利。無限大("Infinity")もNaNも指数表記も扱ってくれる。扱えないのは-0だけかな。
    なお動作確認はFirefox(38.0.5, Windows版)でしかしていない。おまけだし。

    入力:


    出力:
      

  • PICで浮動小数点ウェイトルーチン
    2015年05月26日 00:00

    ふと思いついたので書いてみた。
    呼び出すと、Wレジスタの値を浮動小数点数として見た量だけウェイトを掛ける。
    具体的には、指数部3bit、仮数部5bitで、
    1.仮数×2^(指数+4)
    または指数部が0の時
    0.仮数×2^(1+4)
    で表される値×80。
    最小が1の時の80、最大が255の時の322560…かと思いきやちょうど上手く0の時に327680になっている。
    グラフにするとこうだ。
    PIC_浮動小数点ウェイト

    さて、ふと思いついて面白そうだったので書いてみたのだが、使い道が思いつかない。
    思いついたきっかけは液晶モジュールの初期化時に27μsと1msと200msのようなウェイト量を要求されたからなのだが、数回使うくらいなら固定値のウェイトルーチンで済むし、10回程度までは単純な2バイトのウェイトルーチンを作った方がよいだろう。
    役立てるには数十回のダイナミックレンジの広いウェイトを要求される必要があるが、そのような状況が思いつかない。
    まあ書いてて楽しかったので特に問題はない。

    何か使い道を思いついた方はご自由に使ってください。
    fwait:
    ;使用レジスタ:
    ;cnth, cntl, exp
    ;cnthは事前にゼロクリアのこと。

    ;浮動小数点数を分解して適切な場所に置いたりケチ表現解除
        movwf cntl
        andlw 0xE0
        movwf exp
        btfss STATUS,Z
        bsf cnth,1
        btfss cnth,1
        bsf exp,5
        btfsc cntl,4
        bsf cnth,0
        swapf cntl,F
        movlw 0xF0
        andwf cntl,F
        bcf STATUS,C
    ;指数部が1xxなら4bit左シフト
        btfss exp,7
        goto f1x4
        swapf cnth,F
        swapf cntl,F
        movf cntl,W
        andlw 0x0F
        iorwf cnth,F
        movlw 0xF0
        andwf cntl,F
    f1:
    ;指数部がx1xなら2bit左シフト
        btfss exp,6
        goto f2x1
        rlf cntl
        rlf cnth
        rlf cntl
        rlf cnth
    f2:
    ;指数部がxx1でなければ1bit右シフト
        btfss exp,5
        rrf cnth,F
        btfss exp,5
        rrf cntl,F
    ;素通りに掛かる時間分の調整
        movlw .8 ;40/5
        subwf cntl,F
        btfsc STATUS,C
        incf cnth,F ;繰り下がり処理しつつ+1
    b0:
    ;時間待ち処理本体
    ;ここにウェイトを入れ、上の調整部分も合わせると、全体のウェイト量を定数倍できる
        decf cntl,F
        btfsc STATUS,Z
        decfsz cnth,F
        goto b0
        nop ;時間調整
        retlw 0
    ;分岐の時間合わせ
    f2x1:
        nop
        goto f2
    f1x4:
        goto $+1
        goto $+1
        goto f1
      

  • PICで平方根ルーチンができた気がする
    2015年05月06日 23:32

    なんとなく欲しくなったので作ってみたらできた気がする。
    sqrt:
        movlw 0x60
        movwf diff
        movlw 0x40
        movwf subhnd
        bsf count,3
    sqrtloop:
        movf subhnd,W
        subwf valh,W
        btfsc STATUS,C
        movwf valh
        movf diff,W
        rlf vall,F
        rlf valh,F
        rrf diff,F
        btfss vall,0
        xorwf subhnd,F
        btfsc vall,0
        addwf subhnd,F
        decfsz count,F
        goto sqrtloop
    19命令、固定124サイクル。
    valh:vallに平方根を求める値を入れる。vallに答えが出る。
    このルーチンに入る前にcountはゼロにしておく。

    入力は16bitを受け付けてくれるかと思いきや、大きすぎると計算途中でオーバーフローするようである。
    15bitなら多分大丈夫。もうちょっと大きくても大丈夫な気がする。0b1011...まで大丈夫な気がしたがそんなことはなかった。

    アルゴリズム

    平方根の求め方 - 魔法使いの森
    こちらのタイガー計算器での開平計算のアルゴリズムを参考にした。
    同じことを2進法で行うのだが、2進法なので引く数を増やしながら順に引いていくところは1回だけで終わりである。

    具体的には、
    ・平方根を求める数をAとする
    ・B=1
    {
    ・Aの2nビット目からBを引き、キャリーを答にシフト (そのまま使えるのでPICのボローは楽である)
    ・引けたなら、B++; B<<1; B++
    ・引けなかったなら、B--; B<<1; B++
    ・A<<2
    }繰り返し
    なお図形的に考えたものに合わせAとB両方シフトするように書いたが、実際にはAを1bitシフト、Bを右に伸ばしていくようなコードになっている。これはタイガー計算器でもそうである。
    コードに落としこむにあたって、引けた時と引けなかった時の計算に使う値を1つにまとめたのと、キャリーを壊さずに後の方まで使いまわしているのが楽しいところ。
    引く数は最後の方は下位bitを切り捨てているので答えが多少ずれるだろうと思っていたのだが、いくつか試したところずれていないような気がする。不思議だ。
    (5/7追記: √0が1になった。やっぱりなー。この程度は想定の範囲内。)  

  • ゲームボーイ始めました。
    2015年03月28日 13:04

    ゲームボーイで猫耳
    ファミコンAtari2600GBAに続いて、ゲームボーイにも手を出してみた。

    やっと最近の話になった。冒頭の画像ができたのが今年の2/11である。

    GBは実機で動作させるのが簡単そうな気がするのが嬉しい点。
    たぶんFlashROMを1個用意してカートリッジの線につなげばできると思う。
    これがファミコンだと2個要るし、GBAだとなんだか特殊な回路が入ってるようなことを見た記憶がある。

    CPUは80系ということで初めて触るCPUだった。
    8080→8086→80x86なのでx86と同系統なのだが、x86は触ったことがあったがレジスタ名に多少面影を感じる程度であった。
    新しいCPUのアセンブラを触るのは楽しいのでこれはこれでよい。

    開発環境はググって見つけたGBDKというものを。
    ルートに展開せよと書いてあるがどうせパスの日本語に非対応という事だろうといつもの場所に置いてみたが、どうもパスの指定の関係でルート直下でないと動かないようだ。
    C言語コンパイラもついてるけど、やっぱりアセンブラだよねー。
    アセンブラのサンプルコードも(1個だけ)ついてるので安心。

    アセンブラの起動方法はなんだかんだで手間取ったが分かってみれば簡単だった。
    ..\bin\lcc -Wa-l -Wl-m -o temp.gb temp.s

    ちょっと困ったことに、この開発環境でアセンブルすると先頭のヘッダあたりを自動で生成してくれるのだが、その中の割り込みハンドラ部分が使い方がよく分からない。
    このようなことはよくある。
    CPU自体の割り込みの扱いはそのCPUを使おうとしている時点で大抵理解しているし、分からなかったらいくらでも資料があるので調べればよいだけなのだが、ある特定の開発環境でだけ使われるコードなど知らないし、調べようにもその付属のドキュメントが不足していたらそれまでである。だいたい、CPUが使いたいのであって開発環境を使いたいわけでもないのに、それを調べなくてはいけないというのはなかなかやる気を殺がれるものである。
    まあコードを追って一応使える程度には理解した。

    GBの面白いところとして、全画面に任意の画像が「頑張れば」表示できるという点がある。
    ファミコンのようにキャラクタ数が足りず明らかに不可能でもなく、
    GBAのようにビットマップモードがあって容易に可能でもない。

    GBの全画面を覆うには20*18=360キャラクタ必要。
    しかしGBで背景面に一度に表示できるキャラクタ数は256個。普通には不可能。
    だが、表示する256個のキャラクタは384個の内から2通りの選び方ができる。
    これを、画面の中程で切り替えることで、全画面に任意の表示ができるのである。

    それで全画面表示をしたのが冒頭の画像なのだが、ユニークタイル数を数えてみたら181。普通にも表示できた画像であった。
    単純に減色した画像では芸がないと思って綺麗にベタ塗りにしたのが災いした。

    なおGBカラーになると同時表示キャラクタ数が512個になるので全画面に別のキャラクタを表示することが容易に可能になる。その代わり色数の面で全画面任意とはいかなくなるのだが。

    あと画像表示の前に試したハローワールド
    ゲームボーイ_ハローワールド
    と、7×7(8×8)ドットでは芸がないので5×7ドットのテキストを表示…してみようとしたが2文字で力尽きた。
    ゲームボーイで5×7ドットフォント

    あとエミュレータはGBAでも使っていたので何も考えずVisualBoyAdvanceを使ったが、どうもGBエミュレータではBGBなるものが再現度が高いようだ。  

  • Atari2600はじめました。
    2015年03月24日 01:19

    Atari2600で猫耳1
    ファミコンGBAに続き、Atari2600の開発を始めてみた。
    …と思っていたのだが、Twitterのログやファイルの日付を見ると2011年5月あたり、GBAより前だった。やってすぐに書かないとこういうことになる。

    Atari2600と聞いてもピンと来ない人もいるかもしれない、というか自分自身始める前はおぼろげに名前を聞いたことがあるかという程度だった。
    日本では流行らなかったけれどアメリカの方ではファミコンの前世代機として一時代を築いた名機らしいのだが。

    このAtari2600、当然(総合的な)性能はファミコンを大きく下回るわけだが、画面の描画方法が他のゲーム機には無い独特なもので、挑戦しがいのある機械である。
    詳細な仕様については別に書こうかと思うが、ごく簡単にまとめると以下のようになる。 (4/13追記: 書いた→Atari2600詳細)
    ・画面解像度は横160ドット
    ・背景面は横4ドット単位でしか描けない
    ・スプライトは計5個
     横8ドットの絵が描けるものが2個
     横1ドットが3個
     (スプライトは複製or拡大できるが、詳細は割愛)

    縦は? と思うだろうが、ここがAtari2600最大のポイント。なんとVRAMを走査線1本分しか持っていないため、何もしなければ縦縞しか描けない。絵を作るには1ラインごとにVRAMを書き換える必要がある。
    さらに走査線の描画中でもお構い無しにVRAMを書き換えることができて、スプライトの3倍複製モードで描画するそばから書き換えることで6キャラクタ分48ドットの任意の画像を表示する高等テクニックがある。(実際にはそれだけでは書き換え速度が足りないので裏レジスタを使うというさらにひとひねり必要。詳細は割愛)

    そのテクニックを使って描いたのが冒頭の画像。
    Atari2600のCPUはファミコンと同じ6502(正確にはその機能削減版の6507)なのでプログラムは楽であった。
    なお開発環境はdasm、エミュレータはz26。
    dasmでアセンブルするとなぜか出力ファイルの頭に謎の2バイトが付いてそれを消さないとz26で動かなかった。なんだかよく分からないがとりあえず備忘録的に書いておく。

    あとつい最近またAtari2600をやりたくなって描いた絵を2枚。
    Atari2600で猫耳2
    Atari2600ではちゅねミク
    プログラムもちょこちょこ変えているが外見はただ絵が変わっただけ。下の数字はエミュレータの機能。
    はちゅねミクの絵で分かる人には分かると思うが、次はアニメーションさせたい。  

  • GBAはじめました。
    2015年03月23日 02:04

    GBA_HelloWorld

    ファミコンに続き、ゲームボーイアドバンス(以下GBA)の開発を始めてみた。3年前に。
    Twitterのログやファイルの更新日時を見るに、2012年5/30~6/6くらいにやっていたようである。
    なぜ今頃書くのかというと、そろそろネタを書きためているテキストファイルの見通しが悪くなってきたので整理するためだ。前回のCボタンユニットもそれである。

    開発環境はdevkitProというもの。これが環境を整えるのがすごく楽だった。インストーラの指示に従ってあとは環境変数を書くだけ。
    言語はとりあえずC言語。まあARMくらいの性能になると敢えてアセンブラを使う理由も薄いだろう。
    ARMの命令セットは条件実行機能が面白そうだから使ってみたいんだけどね。

    GBAではフルスクリーンの1枚絵を何の制限もなく表示できる。GBカラーやファミコンではできなかった芸当だ。
    GBA_15bitカラー1枚絵
    GBAの画面モードは色々あるが、これはGBAの最大色数である15bitカラー表示。背景数は1枚のみである。
    使用した画像データはこちら。
    GBA用画像_青肌
    GBAの色データはxBBBBBGGGGGRRRRRであるが、GIMPで出力する15bitカラーはxRRRRRGGGGGBBBBBしか出せず、RとBを入れ替えて書き出しているため、不気味な色になってしまった。上下反転はBMP画像の特徴。

    もう1枚、こちらは256色インデックスカラー。このモードでは背景面が2枚持てる。
    GBA_インデックスカラー1枚絵

    次はGIF画像を表示したり簡単な落ち物ゲームを作ろうかと思っていたようだが力尽きたようだ。
    その後最近になって(14年8月~11月あたり)、1カートリッジプレイで無改造で実機で動作させることを目指してPICで通信実験などしていた。
    そのうち再開したい。  

  • ファミコンの縦解像度224px説の考察
    2015年02月22日 04:49

    ファミコンの解像度は横256px×縦240pxだが、縦を224pxとする説が根強い。
    中には「内部的には240px」の但し書きをつけたり、「約」224pxとするものもあるが、224という値を書いている時点で五十歩百歩だ。

    「内部的」の解釈も曖昧だが、たぶん次のような認識なのだろう。
    「メモリ上には240px分の領域が用意されているが、出力されるのはそのうちの224px分のみ」
    そのようなことがないのは、Google画像検索で適当なファミコンソフト名を「640×480」や「720×480」の解像度指定で検索すれば分かるだろう。

    ただ似たような現象はあって、240px分が出力されても、普通のアナログTVでは実際に画面に表示されるのはその内の85%や90%程度である。
    (詳しくは「タイトルセーフ・アクションセーフ」「オーバースキャン」あたりで検索するとよい)
    ではそのことを言っているのかというと、2つの点からおかしい。
    第1に、どの程度の範囲が表示されるかはTVによって異なるので、224pxという値は出てこない。「約」であっても(10進法では)切りの悪い値にするのは不自然だ。
    第2に、TVに映らないという理由で解像度を224pxなどの値にするなら、同様にアナログTVに出力するスーパーファミコンやプレイステーションも240pxや480pxを出力できないことになろうが、これらの解像度には239pxや480pxという値が平気で書かれている。

    ではこの224という数字の出処はどこかだが、スーパーファミコンにはどうやら224pxモードがある。
    これこれを見ると、$2133のbit2で縦224pxと239px(448pxと478px)の切り換えができるようだ。
    またプレイステーションについても、興味が無いのであまり調べていないが、224pxや448pxのモードがあるような記述が見られる。

    もう1つの可能性として、エミュレータのオプションから来ているのかもしれない。
    エミュレータには縦240pxのうち224pxのみを表示するモードが付いている物がある。
    エミュレータ240pxモード1エミュレータ240pxモード2
    (というよりどちらもデフォルトが224pxで、240pxモードがある)

    まとめると、
    ・そもそもアナログTVの仕様として映像信号のうち画面には表示されない部分がある
    ・スーパーファミコンには縦224px出力のモードがある
    ・ファミコンのエミュレータには出力のうち縦224pxのみしか表示しないモードがあるものがある
    このあたりを混同した結果、ファミコンの縦224px説が生まれたのではないだろうか。


    さて本題の考察は以上だが、なぜエミュレータには224px設定が付いているのかの説明をしよう。
    まずこちらの画像をご覧頂きたい。
    ファミコン縦スクロール回り込み
    ドラゴンクエスト3で縦スクロール中に撮った画像だ。これは互換機だが、ファミコン実機でも同様の表示になるはずである。
    一番下の数ドットが、本来下に続くマップではなく、最上段からはみ出した分が下に回りこんでいるのが見て取れるだろう。

    これはファミコンの仕様で、内部的に2画面分を縦または横につなげた仮想画面をスクロールしているため、縦か横どちらか、この場合縦は1画面分の幅しかなく、スクロール時に上下にまたがるキャラクタは表示が乱れるのである。
    この乱れは、上記の通り通常のアナログTVでは画面外で表示されない部分であり、ユーザーの目にはいることはまずない。
    しかしPCのキャプチャカードで全ての出力を取り込んだり、エミュレータで全てを表示すると見えてしまうわけだ。
    そこでエミュレータでは、この本来表示されない領域を隠す設定が付けられた。
    どれだけ隠せばいいかといえば、背景面を構成するキャラクタは16×16単位で設定できる(正確には色が16×16、キャラが8×8)ので、うまく作られたプログラムなら半分の8pxづつだけ隠せばよいはずである。
    (うまく作られたプログラムばかりでもないと思うが)

    また、横についても同様の乱れが起こる。さらに縦と違う点として、ファミコンは横方向はもともと映像表示期間の90%強しか使っていないため、少し広めのTVではこの乱れが画面内に見えてしまう場合がありうる。
    おそらくそのために、ファミコンには左のみ8pxを表示しない設定がある(両側でないのはなぜだろう)。上のドラクエ3の画像もそうなっている。左右の黒帯の幅が違うことから分かるだろう。
    これを考えると、ファミコンの解像度は248×240と256×240の2モードあるとすべきだろう。

    2016/09/04追記
    左8pxを表示しないモードについて、スクロール時の乱れを見せないためだろうと推測したが、おそらく違った。
    ファミコンのスプライトは横8px幅であり、そのX座標は0-255の値をとり、0で左端、248で右端、249-255では右端からはみ出す位置になる。つまり画面の右端からスプライトの一部分が見える表現はできるが、左端で同じことはできない非対称性がある。
    ここで左端8pxを背景・スプライトともに隠すことで、左端からスプライトの一部分が見える表現が可能となる。
    両側でない理由もつくのでこれがこの機能を付けた理由で間違いないだろう。乱れを見せないためにも使えたかもしれないが、少なくともメインの目的ではないだろう。
    なおこちらによればMSXやSG-1000ではスプライトの表示位置を32pxずらす機能があったらしい。  

  • EEPROM書換え上限テスト
    2014年11月17日 08:06

    PICマイコンに内蔵されていたりするEEPROMには書換え回数に限界がある。
    PIC16F628A内蔵のものでは、書換え耐性は最小10万回、標準100万回となっている。
    これをテストしてみよう。

    なおこれは既にやっている方がいる。
    参考: 自己満足系 「PIC耐久試験」

    同じことをやっても芸が無いので、書込みデータを変えてみた。
    EEPROMの書き込み手順はまず0xFFにクリアしたのち、必要なbitのみ0にするという手順を踏むそうだ。
    であれば「0」のみを書き込み続けた場合と「0」「1」を交互に書き込んだ場合では「0」のみの方が早く限界に達するはずだ。
    これはMicrochip社のアプリケーションノート「AN537」を見てもそう書いてある。(figure4)
    これを確かめるため、書込みデータは「0x5C」と「0xAC」の交互にした。上位(7bit目~4bit目)が0/1交互、3,2bit目が1固定、下位(1,0bit目)が0固定だ。
    これが意外な結果になるのだが…。

    プログラムは最後に載せるが、内容を説明すると以下のとおり。
    ・電源ONでまずEEPROMの内容を全て出力し、その後待機状態に入る
    ・スイッチを押すとLEDを点灯させて開始を示し、1秒後に消灯して処理を開始
    ・書込み後に読み出してベリファイし、値が異なっていればエラー表示をして終了
    ・0x5Cと0xACの2回の書き込みを1セットとし、256セットごとにEEPROMに書込み回数を保存
    ・256セットごとにスイッチを監視して、一時中断が可能

    装置はこんな感じ。
    EEPROM破壊装置
    下の3つは置き場が無くて挿してあるPICで、回路に無関係である。上のコンデンサについては後述する。
    橙の線はスイッチ代わり。LEDは開始・終了のインジケーター。もう1個エラー表示もつけようと思ってプログラムもそう書いたのだが、よく考えてみれば終了LEDだけでことが済んだのでつけなかった。
    余談だが、LEDが青なのはこの試験中に青色LED開発者がノーベル賞を取ったのでなんとなく元は赤だったのを変えてみたためだ。

    試験を開始する。
    電源は仕様上3V以上必要なのだが、いつもEneloop2本で動かしているので今回もそれでやってしまった。どうせ厳密な試験をするつもりもなし、動いてるので問題ないだろう。
    まず少々処理が進んだところで一時中断し、書き込み速度をチェックする。
    どうやら1回あたり5msほど掛かっている。時間からして書き込みは行われているようだ。
    (プログラムの製作中は書き込み操作をコメントアウトしていたが、この時はマイクロ秒単位でループが回っていた)
    ここから破壊予定を計算してみよう。
    100000*5/1000/60=8.33
    1000000*5/1000/60/60=1.39
    より、最小の10万回ならわずか8分強、標準の100万回でも1時間半ももたない計算になる。
    上記の先人の使った16F84は標準1000万回のところ2300万回で破壊に至ったということなので、同じ割合なら3時間ほど。
    何日も点けっぱなしにするのは面倒なのでこれは楽でいい。
    と思ったのだが…。

    試験はTwitterにつぶやきながら行っていたので、ログを見ながら進行状況を書いていく。
    10/05 16:55 試験開始
    10/05 17:13 開始20分で2*0x1A400回 (※書き込み2回ごとに1カウントしている)
    10/05 18:43 標準値を突破、1.3M回超
    10/05 20:04 標準寿命の倍を超えたがまだ動く
    10/05 21:12 3.1M回を超える
    10/05 22:15 2*1D6600回
    10/05 23:56 5M回
    10/06 01:51 6.5M回
     標準寿命の2,3倍程度だろうと思っていたため、寝る前に終わる予定でいたので困る。
    10/06 06:04 結局点けっぱなしで朝、9.5M回
     標準寿命の10倍近くでまだ正常と主張しているのでそろそろプログラムのミスが疑われ始める。
     とりあえず中断し、電池を充電する。
    (10/06 21:38 再開時刻記録忘れ。遅くともこの時刻)
    10/07 00:22 11,661,312回
     本格的にプログラムのミスが心配になる。
    10/07 01:44 ついに終了

    以上、延べ17.25時間掛けて、12,663,170回目でエラー発生。なんと標準値の12倍ももつという記録が出た。
    書込み回数の記録をグラフにするとこんな感じ。
    EEPROM書込み回数グラフ
    記録がいい加減(「標準の倍を超えた」とか)なわりには意外と綺麗なグラフになっている。温度で書込み時間に違いが出たりするかと期待していたが、少なくともこのレベルの記録には残らないようだ。

    エラーの内容だが、8Cが読めているので、ACを書き込んで8Cが読めた、つまり5bit目が異常になったエラーのようだ。これは不思議なことで、前述のとおり常に0を書いている下位2bitが真っ先にやられるものと予想していた。
    それはそうとここから先は未知の領域なのでとりあえず試験を続ける。
    まず意外だったのが、一度8Cが読めた箇所を20回ほど読んでみても正しくACが読めることだ。どうやらEEPROMのエラーというものは、一度エラーが出たらそれっきりというものではなく、「書いた値が稀に正常に読めない」という症状を示すようだ。
    その後再度同じプログラムで走らせても、しばらくの間は正常にベリファイが走る。やはりエラーは確率的なもののようだ。
    これを考えると、テストのやり方は正しくなかったと言える。1千万回で初めてエラーが出たとして、それ以前から確率的に読み取れない状態になっていたのだろうから、ある程度の回数書き込むたびに読み出しが正しくできるかのテストを数百回なり数千回なり読み出してみて調べるべきだろう。まあこれは今後の研究課題ということで。

    さてその後も同じプログラムで何度も走らせてみた。結果がこれだ。
    EEPROM書込みエラー記録
    プログラムを走らせ、エラーが発生して停止するまでに書込みが行われた回数を毎回記録している(最後除く)。
    3色の◆の部分が最初と同じプログラムで走らせたものである。
    傾向として最初の1266万回から回を追うごとに減っていき、15回目あたりからエラーまでの書き込み回数がほぼ一定になっているのが見て取れる。これは512回である。
    最初に書いたとおり、このプログラムでは2回×256セットごと、すなわち512回ごとにEEPROMに書込み回数を保存している。つまりこの書込み直後の読み込みが失敗しやすいようである。
    この原因として書込みによって電圧が下がっている可能性を考え、コンデンサを付けてみた(赤部分)。するとしばらくの間書き込みエラーが起こりにくくなったような気もするが、またコンデンサを外しても14万回とかなりの回数が出たのでよく分からない。
    もう少し確かめてみたかったが、そうこうしている間に別のエラーが発生した。
    部分が、読めた値が2Cであった部分である。AC→2Cになったものであろうから、7bit目が異常になったようだ。またも上位bitからエラーが発生した。このとき累計書込み回数1663万回。
    その後数回2Cが続き、再び8Cでのエラーが発生。
    ここで、プログラムを変更する。異常になった2つのbitをマスクして、他のbitのみを見るようにした。これが紫部分。
    変更後最初のエラーまでに64万回、累計1765万回。1Cが読めたので、5C→1Cで6bit目が異常。
    その後2回ほど試したのち、またマスクを変更。3つのbitをマスクする。これが水色部分。(なぜか凡例だけマークが「*」になっているが、Excelが異常で凡例のマークをどうやっても変更できなかった)
    変更後最初のエラーまでに209万回、累計1974万回。4Cが読めたので、5C→4Cで4bit目が異常。
    これで上位4bitが全て異常になり、下位4bitには異常が見られないという状況になった。
    不可解だがとりあえず続けよう。マスクを変更。上位4bitをマスクするようにした。
    すると、いつまで走らせても一向にエラーが起こらない。累計1億回、すなわち標準寿命の100倍に達してなおエラーが出なかったので、あきらめて試験を終了することにした。この時点が橙である。

    以上まとめると、0/1を交互に書き込んだ場合は標準寿命の10~20倍で最初のエラーが発生し、0のみまたは1のみを書き込んだ場合は標準寿命の100倍を超えてもエラーが発生しないという結果になった。
    資料から予想した結果と違っており不可解だが、この結果から考えられることとして、PICのEEPROMは前回と同じ値を書き込むときは消去・書込み動作を行わないのだろうか。
    EEPROMはバイトごとに消去が行われるものと思っているのだが、bitごとの消去ができるものもあるのだろうか。この辺も今後の研究課題である。

    また、エラー発生時の累計回数の生データを見ると1つ不思議なことが分かる。以下がそのデータだ。
    609CC0, 6545D4, 675110, 67C8C0, 6A3690, 6A3700, 6AB598, 6AB600, 6AB710, 6AB800, 6AC59C, 6B08C0, 6B0D58, 6B14D0, 6B1500, 6B1600, 6B1700, 6B1800, 6B1900, 6B1A00, 6B1B00, 6B1C00, 6B1D00, 6B1E00, 6B1F84, 6B2048, 6B2100, 6B2200, 6B2304, 6B2400, 6B2500, 6B2600, 6B2700, 6B3380, 6CE7D8, 6CE800, 6D0904, 6D2590, 6D2654, 6D2710, 6D2800, 6D4184, 6D4200, 6EB540, 702D10, 702E10, 702F00, 703000, 745114, 7A5C14, 7A5D10, 7A5E04, 7D1404, 7D1504, 7E2B0C, 7E2C00, 7E2D00, 7EE104, 7EE200, 7EE30C, 7EED00, 81C300, 86A514, 86A600, 86A70C, 969F00
    1の位に0,4,8,Cと4の倍数しか現れていない。00になるのはEEPROM書込み直後なので分かるとして、4の倍数、すなわち8回ごとにエラーが起こる理由が分からない。内部構造に原因があるのだろうか。今後の研究課題だ。研究課題多いなあ。

    最後にコード。
        list p=16f628a
        #include p16f628a.inc
        radix dec
        __CONFIG _INTOSC_OSC_NOCLKOUT & _WDT_OFF & _PWRTE_ON & _CP_OFF & _LVP_OFF & _MCLRE_ON & _BODEN_OFF

        radix dec


    ;     RA2 +-v-+ RA1
    ;     RA3 |   | RA0
    ;     RA4 |   | RA7
    ; Vpp RA5 |   | RA6
    ;     GND |   | Vdd
    ;     RB0 |   | RB7 PGD
    ;     RB1 |   | RB6 PGC
    ;     RB2 |   | RB5
    ;     RB3 +---+ RB4

    ; EEPROM制御がしやすいよう、変数はbank1にとる
        cblock 0xA0
            targetaddr
            dataaddr
            cnt0,cnt1,cnt2
            cnt232
            dat,datbuf
            waitcnt0,waitcnt1
        endc
    ; 結局使わなかった割り込み退避用変数
        cblock 0x70
            wbuf
            sbuf
        endc


    #define TESTPTR 0x00
    #define MASK 0xFF ;結果をマスクするときここを変える

    ;pin
    #define TXPIN232 0
    #define BUTTON 1
    #define ERRLED 2
    #define STOPLED 3

        org 0
        goto init

        org 4
        retfie

    init:

        bsf STATUS,RP0 ;BANK1
        movlw b'00000011'
        ;       ^/pull up enable
        ;        ^int edge
        ;         ^tmr0 clock source 0:internal
        ;          ^tmr0 source edge
        ;           ^prescaler assignment 0:tmr
        ;            ^^^prescaler rate
        movwf OPTION_REG
        movlw 1<<BUTTON
    ; 間違ってPORTBの値を設定する前にTRISBを設定しているのでたまにシリアル出力の先頭が化けることに後で気づいたが直し忘れた
        movwf TRISB
        bcf STATUS,RP0
        movlw 0x07
        movwf CMCON
    ; EEPROMの制御のためコードはすべて全てbank1で走らせる
    ; そのため変数はすべてbank1にとった
    ; bank0のレジスタでPORTBだけ必要なのでINDFをPORTBにしておく
        banksel 0x80 ;bank1
        movlw PORTB
        movwf FSR ;INDF=PORTB
        clrf INDF
        clrf cnt232
    ; EEPROMに保存してある書込み回数カウントを取得
        movlw (~TESTPTR)&0x7F
        movwf targetaddr
        movlw TESTPTR*4
        movwf dataaddr
        
        movf dataaddr,W
        movwf EEADR
        bsf EECON1,RD
        movf EEDATA,W
        movwf cnt2
        incf dataaddr,W
        movwf EEADR
        bsf EECON1,RD
        movf EEDATA,W
        movwf cnt1
        movf dataaddr,W
        addlw .2
        movwf EEADR
        bsf EECON1,RD
        movf EEDATA,W
        movwf cnt0
    ; 書込み回数カウントを…と思ったが面倒なのでEEPROM全体をシリアルに出力
        movlw '/'
        call tx232
    showeep:
        clrf EEADR
    showeeploop:
        bsf EECON1,RD
        movf EEDATA,W
        call tx232hex
        incf EEADR,F
        btfss EEADR,7
        goto showeeploop
    ; スタート待ち
        btfsc INDF,BUTTON
        goto $-1
    ; LEDを1秒点灯させスタート表示 (停止表示用だった名残が名前に見える)
        bsf INDF,STOPLED
        
        call wait1s
        
        bcf INDF,STOPLED

    main:
        movf targetaddr,W
        movwf EEADR

    mainloop:
    ; データAを書込み、読み取り、比較
        movlw 0x5C ;データA
        call writeeep
        clrf EEDATA
        bsf EECON1,RD
        movlw 0x5C
        xorwf EEDATA,W
        andlw MASK
        btfss STATUS,Z
        goto err

        movlw 0xAC ;データB
        call writeeep
        clrf EEDATA
        bsf EECON1,RD
        movlw 0xAC
        xorwf EEDATA,W
        andlw MASK
        btfss STATUS,Z
        goto err

        incfsz cnt0
        goto f
    ; 256カウントごとの操作
    ; 上位カウント
        incf cnt1,F
        btfsc STATUS,Z
        incf cnt2,F
        bcf STATUS,C

    ; カウント値を保存
        movf dataaddr,W
        movwf EEADR
        movf cnt2,W
        call writeeep
        
        incf dataaddr,W
        movwf EEADR
        movf cnt1,W
        call writeeep
        
        movlw 0x02
        addwf dataaddr,W
        movwf EEADR
        movf cnt0,W
        call writeeep

    ; ボタンを確認し、押されていれば中断
        btfss INDF,BUTTON
        goto stop

    f:
        goto mainloop

    ; 書込みエラーが発生したら、カウント下位および読み取った値を書き込んで、LEDを点灯させ停止
    err:
        bsf dataaddr,1
        incf dataaddr,W
        movwf EEADR
        movf EEDATA,W
        call writeeep
        movf dataaddr,W
        movwf EEADR
        movf cnt0,W
        call writeeep
        
        bsf INDF,ERRLED

    stop:
        bsf INDF,STOPLED
        goto $

    ; EEPROM書込みサブルーチン
    ; WをEEADRで示すアドレスに書き込む
    writeeep:
        movwf EEDATA
        bsf EECON1,WREN
        movlw 0x55
        movwf EECON2
        movlw 0xAA
        movwf EECON2
        bsf EECON1,WR
        btfsc EECON1,WR
        goto $-1
        return

    ; Wを16進表記でシリアル出力 (IOピン直結)
    tx232hex:
        movwf datbuf
        swapf datbuf,W
        call sendnibble
        movf datbuf,W
        call sendnibble
        return

    sendnibble:
        andlw 0x0F
        movwf dat
        movlw .6
        addwf dat,F
        movlw '0'-.6
        btfsc STATUS,DC
        movlw 'A'-.10-.6
        addwf dat,W
    ; Wをシリアル出力
    tx232:
        movwf dat
        bsf INDF,TXPIN232
        bsf cnt232,3
    tx232loop:
        rrf dat,F
        movf INDF,W
        andlw ~(1<<TXPIN232)
        btfss STATUS,C
        iorlw 1<<TXPIN232
        movwf INDF
        decfsz cnt232,F
        goto tx232loop
        goto $+1
        goto $+1
        nop
        bcf INDF,TXPIN232
        
        retlw 0

    ; 1秒くらい待つ
    wait1s:
        clrf waitcnt0
        clrf waitcnt1
    waitloop0:
    waitloop1:
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        goto $+1
        decfsz waitcnt1
        goto waitloop1
        decfsz waitcnt0
        goto waitloop0
        
        return

    ; 初回のみここのコメントを外してビルドしEEPROMのデータ保存領域を0で初期化する
    ;    org 0x2100
    ;    dt 0,0,0,0,0,0
        
        end
      

  • 最弱のPICマイコンでカレンダー_ちょっと短縮
    2014年11月02日 04:03

    先日の「最弱のPICマイコンでカレンダー」だが、ちょっと思いついてコードを短縮してみた。いい感じにキモくなったと思う。

    変更箇所は2点。
    【シリアル通信】
    元のコードではRS232Cシリアルの送受信コードをそれぞれ書いていたが、これを1つにまとめることにより短縮した。
    コア部分がこちら。1つのループの中で1bitの送信と受信を同時に行うようになっている。
    loop232:
        movlw 0xF8
        addwf GPIO,W  ;0xF8を足すことでGPIO[3]をCに入れる
        movlw 1<<TXPIN
        rrf dat232,F  ;ローテートでCをバッファに、バッファの反対端をCに
        btfsc STATUS,C
        xorwf GPIO    ;送信データに応じてGPIOの送信ピンをトグル
        decfsz cnt232
        goto loop232
    具体的な挙動は次のようになる。
    ・送信時
    バッファに送信データを入れておき、スタートビットを送信してからこのループで1bitづつ送信する。
    (なお時間の都合でXORでトグルしているので、事前にバッファに入れる値を調整しておく必要がある。)
    同時に受信操作も行われるが、特にスタートビットに合わせているわけではないので、無意味な値が取れる。
    ・受信時
    バッファに全0を入れておき、スタートビットの受信を待ってからこのループで1bitづつ受信する。
    同時に送信操作も行われるが、スタートビットも出さずデータが全0なので何も起こらない。

    これで2つが1つになったので半分くらいに縮んでほしかったのだが、前処理が増えたせいで計30ワード→25ワードとわずかな短縮に留まった。まあ縮んだだけよしとしよう。

    【月データ】
    元のコードでは月ごとに「当該月の日数」と「基準の年の当該月1日の曜日」の2つのテーブルを持っていた。
    しかし月の日数は28~31、曜日は0~6しか値を取らないので、それぞれ1バイトとるのは無駄が多い。
    そこで2つのデータを1バイトにまとめてみたのだが、最初は単純に上下4bitづつに分け、月の下位4bitと曜日を表そうとしていた。
    しかし途中でもっといい方法を思いついた。
    ・下位bitで月を表す。
    ・残りのビットを適に設定して、全体でmod7で曜日を表す数にする。
    というものだ。なおmodの計算の都合上全体の数は132を超えられないので、最上位bitは実質0固定。そして曜日に3bit使うので、月には4bitしか残らず、あとで0x10を足す形になった。
    それでできた値がこれだ。
    getmonthattr:
        addwf PCL,F
        dt .95, .28, .63, .94, .47, .78,
        dt .31,.111, .30, .95,.126, .79,
        dt .31,.125

    さらにmodの計算ルーチンを変えて1命令短縮した。
    元は「7を引き続け、0を下回ったらループを抜け、答えを0~6にするため7を足して完了」というものだったが、最後の7を足す部分が無駄である。
    そこで「7を足し続け、オーバーフローしたら完了」に変えた。このため256%7=4だけ値を補正しておく必要がある。

    これにより、テーブルが1つ減って15ワード減、読み取り部分はなんだかんだで同命令数、mod7の1命令減があって計16ワードとかなりの短縮になった。


    この2点の変更で188ワード→167ワードとなった。
    PICのコードをバイトで数えることはあまりしないのだが、計算してみると167*1.5=250.5バイト。おお、256バイトを切っている。

    なお、感覚としてはもう数命令は縮められそうな気はするが、縮めたところで別に他に入れる機能もなし、面白いことは無いかなと思うので今のところやる気はしない。
    とりあえず「Y?>」「M?>」のメッセージを無くすだけで13ワード縮む。

    全コードは以下。
        list p=10F200
        #include p10f200.inc
        radix dec

        __CONFIG _MCLRE_OFF & _CP_OFF & _WDT_OFF

        cblock 0x10
            dat232
            yearh, yearl, month
            cnt, dowcnt, daycnt, cnt232
            day
            temp
        endc

    ;ピン
    #define TXPIN 0
    ;RXPINは3固定

        org 0
    init:
        movwf OSCCAL ;クロック補正値セット
        movlw b'11001000'
        ;設定データ。プルアップOFF、他Don'tCare
        ;ちょうど下位3bitがDon'tCareなのでI/O設定と共用
        clrf GPIO ;出力ピンを全Lowに
        tris GPIO ;I/Oモード設定
        option ;設定

    main:
        clrf cnt
        clrf cnt232

    ;"Y?>"
        movlw 'Y'
        call tx232
        movlw '?'
        call tx232
        movlw '>'
        call tx232
       
    ;年4桁受信: abcd
    ;年上位 = 10a+b ≡ 2a+b
        call rx232
        movf dat232,W
        movwf yearh ;*1
        addwf yearh,F ;*2
        call rx232
        movf dat232,W
        addwf yearh,F
    ;年下位 = 10c+d
        call rx232
        movf dat232,W
        movwf yearl ;*1
        bcf STATUS,C
        rlf yearl,F ;*2
        rlf yearl,F ;*4
        addwf yearl,F ;*5
        rlf yearl,F ;*10
        call rx232
        movf dat232,W
        addwf yearl,F

    ;"M?>"
        call newline
        movlw 'M'
        call tx232
        movlw '?'
        call tx232
        movlw '>'
        call tx232
       
    ;月2桁受信: ef
        call rx232
        movf dat232,W
        andlw 0x01 ;1っぽければ10をセット
        btfss STATUS,Z
        movlw .10
        movwf month
        call rx232
        movf dat232,W
        andlw 0x0F
        addwf month,F ;C0

    ;閏年判定
        movf yearl,W ;年下位を取り、
        btfsc STATUS,Z ;0なら
        movf yearh,W ;年上位を取り、
        andlw 0x03 ;下位2bitが
        btfss STATUS,Z ;0でなければ
        goto notleap ;平年。

    ;閏年1,2月を13,14月扱い
        movlw .3
        subwf month,W
        movlw .12
        btfss STATUS,C
        addwf month,F
    notleap:

    ;年ごとの曜日の基準を算出
    ;年下位 + 年下位/4 + (年上位%4)*2
        rrf yearl,W
        movwf temp
        rrf temp,W
        andlw 0x3F
        addwf yearl,F
        rlf yearh,W
        andlw 0x06
        subwf yearl,F
    #define doworg yearl ;名前変更: DoW origin

    ;当月の曜日の差分に相当する数を基準に足す
    ;および、当月日数を取得
        decf month,W
        call getmonthattr
        addwf doworg,F
        andlw 0x0F
        iorlw 0x10
        movwf daycnt

    ;mod7を求めるが、簡略化のため、
    ;7を加算していきキャリーが出た時点で終了する。
    ;256%7=4だけずれるのでデータ側で補正済
        movlw .7
    mod7loop:
        addwf doworg,F
        btfss STATUS,C
        goto mod7loop

    ;ループ用にNと(6-N)を生成、コードの都合上+1
        movlw .8
        movwf dowcnt
        incf doworg,W
        subwf dowcnt
        movwf cnt
       
        call newline

    ;月初めの日まで空白で埋める
        goto dayadjstart
    dayadjloop:
        movlw ' '
        call tx232
        movlw ' '
        call tx232
        movlw ' '
        call tx232
    dayadjstart:
        decfsz cnt,F
        goto dayadjloop

        clrf day
    dayoutloop:
    ;表示用日(BCD)を++
        movlw .7
        addwf day,F
        movlw .6
        btfss STATUS,DC
        subwf day,F
       
    ;1日分の表示
        movlw ' '
        call tx232
        swapf day,W
        andlw 0x0F
        btfsc STATUS,Z
        movlw ' '
        btfss STATUS,Z
        iorlw 0x30
        call tx232
        movf day,W
        andlw 0x0F
        iorlw 0x30
        call tx232

        decf daycnt,F
        btfsc STATUS,Z
        goto break ;1月分出力完了で抜ける

        decfsz dowcnt,F
        goto dayoutloop ;日ループ

        movlw .7
        movwf dowcnt
        call newline
        goto dayoutloop ;週ループ
    break:
        call newline

        goto main

    ;### subroutine ###

    ;改行を出力
    newline:
        movlw '\r'
        call tx232
        movlw '\n'
        call tx232
        retlw 0

    ;下位4bitが「当該月の日数」であり、
    ;全体が「基準の年の当該月1日の曜日+4」とmod7で等しいような数を返す
    getmonthattr:
        addwf PCL,F
        dt .95, .28, .63, .94, .47, .78,
        dt .31,.111, .30, .95,.126, .79,
        dt .31,.125

    ;RS232Cで1バイト受信し、下位ニブルのみ返す
    rx232:
        btfss GPIO,3 ;rx start [0,3)
        goto $-1
        clrf dat232
        goto $+1
        goto f
    ;RS232Cで1バイト送信する
    tx232:
        movwf dat232
        bcf STATUS,C
        rlf dat232,W
        xorwf dat232,F
        bsf GPIO,TXPIN ;tx start 0
    f:
        bsf cnt232,3
    loop232:
        movlw 0xF8
        addwf GPIO,W ;read [9,12)+9n
        movlw 1<     rrf dat232,F
        btfsc STATUS,C
        xorwf GPIO ;write 7+9n
        decfsz cnt232
        goto loop232

        movlw 0x0F
        andwf dat232,F
        xorwf dat232,F
        goto $+1
        bcf GPIO,TXPIN ;stop
        retlw 0

        end
      

  • 最弱のPICマイコンでカレンダー
    2014年10月30日 01:12

    「プロ生ちゃんカレンダー プログラミング プチコンテスト 2014」という面白そうなものを知った。
    カレンダーに載せる、"カレンダーを表示するソースコード"を募集するコンテストである。
    思えばカレンダーのプログラムを書いたことが無かったので自分も何か書いてみたくなり、さて何で書くかと考えたところ、やはり最近マイブームなPIC10F200でいくことにした。
    (その後よく考えてみたらJavaScriptでカレンダーを書いたことがあったが、まあ自力で閏年判定とかが初めてということで)

    コードは末尾に載せたが、中でも今回自分で書いてて気に入っているポイントをいくつか挙げると、
    ・数値を受け取るそばから要らない部分を捨てて保存する(年の1000の位は2倍して100の位に足す)
    ・不正な値は完全無視(月の10の位は最下位bitしか見てないとか)
    ・6命令で閏年判定
    movf yearl,W
    btfsc STATUS,Z
    movf yearh,W
    andlw 0x03
    btfss STATUS,Z
    goto notleap
    といったあたり。
    あとはいつも使ってるコードだけどシリアル送受信は自信作。

    使い方は、シリアルポートに抵抗だけ挟んで写真のように直結し、電源ON。
    PIC10F200カレンダー_回路

    「Y?>」に対して年を4桁で、「M?>」に対して月を2桁で入力すると、当該月のカレンダーを出力してまた「Y?>」から入力待ちとなる。
    表示はこんな感じ。(ローカルエコーON)
    PIC10F200カレンダー_コンソール
    プログラム容量は余裕があるのでもうちょっとまともなメッセージにしてもよかったかもしれない。

    以下プログラム。
    プログラム容量は188ワード。PIC10F200の容量256ワードのうち使用率75%ほど。
    (なお最初書き上げたときは201ワードだったのだが、コードにコメントなどつけて整理していたらいつの間にかここまで縮んでしまった。)
    使用メモリは11バイト。16バイトの7割。
    どちらも余裕であった。
    ;### PIC10F200 Calendar###
    ;by Ikadzuchi (@Pleist)
        list p=10F200
        #include p10f200.inc
        radix dec

        __CONFIG _MCLRE_OFF & _CP_OFF & _WDT_OFF

        cblock 0x10
            txdat, rxdat
            yearh, yearl, month
            cnt, dowcnt, daycnt, cnt232
            day
            temp
        endc

    ;ピン
    #define TXPIN 0
    #define RXPIN 3

        org 0
    init:
        movwf OSCCAL ;クロック補正値セット
        movlw b'11001000'
        ;設定データ。プルアップOFF、他Don'tCare
        ;ちょうど下位3bitがDon'tCareなのでI/O設定と共用
        clrf GPIO ;出力ピンを全Lowに
        tris GPIO ;I/Oモード設定
        option ;設定

    main:
        clrf cnt
        clrf cnt232

    ;"Y?>"
        movlw 'Y'
        call tx232
        movlw '?'
        call tx232
        movlw '>'
        call tx232

    ;年4桁受信: abcd
    ;年上位 = 10a+b ≡ 2a+b
        call rx232
        movf rxdat,W
        movwf yearh ;*1
        addwf yearh,F ;*2
        call rx232
        movf rxdat,W
        addwf yearh,F
    ;年下位 = 10c+d
        call rx232
        movf rxdat,W
        movwf yearl ;*1
        bcf STATUS,C
        rlf yearl,F ;*2
        rlf yearl,F ;*4
        addwf yearl,F ;*5
        rlf yearl,F ;*10
        call rx232
        movf rxdat,W
        addwf yearl,F

    ;"M?>"
        call newline
        movlw 'M'
        call tx232
        movlw '?'
        call tx232
        movlw '>'
        call tx232

    ;月2桁受信: ef
        call rx232
        movf rxdat,W
        andlw 0x01 ;1っぽければ10をセット
        btfss STATUS,Z
        movlw .10
        movwf month
        call rx232
        movf rxdat,W
        andlw 0x0F
        addwf month,F ;C0

    ;閏年判定
        movf yearl,W ;年下位を取り、
        btfsc STATUS,Z ;0なら
        movf yearh,W ;年上位を取り、
        andlw 0x03 ;下位2bitが
        btfss STATUS,Z ;0でなければ
        goto notleap ;平年。

    ;閏年1,2月を13,14月扱い
        movlw .3
        subwf month,W
        movlw .12
        btfss STATUS,C
        addwf month,F
    notleap:

    ;年ごとの曜日の基準を算出
    ;年下位 + 年下位/4 + (年上位%4)*2
        rrf yearl,W
        movwf temp
        rrf temp,W
        andlw 0x3F
        addwf yearl,F
        rlf yearh,W
        andlw 0x06
        subwf yearl,F
    #define doworg yearl ;名前変更: DoW origin

    ;当月日数を取得
        decf month,W
        call getdaysinmonth
        movwf daycnt
    ;当月の曜日の差分を取得し基準に足す
        decf month,W
        call getfirstdayinmonth
        addwf doworg,F

    ;%=7
        movlw .7
    mod7loop:
        subwf doworg,F
        btfsc STATUS,C
        goto mod7loop
        addwf doworg,F

    ;ループ用にNと(6-N)を生成、コードの都合上+1
        movlw .8
        movwf dowcnt
        incf doworg,W
        subwf dowcnt
        movwf cnt

        call newline

    ;月初めの日まで空白で埋める
        goto dayadjstart
    dayadjloop:
        movlw ' '
        call tx232
        movlw ' '
        call tx232
        movlw ' '
        call tx232
    dayadjstart:
        decfsz cnt,F
        goto dayadjloop

        clrf day
    dayoutloop:
    ;表示用日(BCD)を++
        movlw .7
        addwf day,F
        movlw .6
        btfss STATUS,DC
        subwf day,F

    ;1日分の表示
        movlw ' '
        call tx232
        swapf day,W
        andlw 0x0F
        btfsc STATUS,Z
        movlw ' '
        btfss STATUS,Z
        iorlw 0x30
        call tx232
        movf day,W
        andlw 0x0F
        iorlw 0x30
        call tx232

        decf daycnt,F
        btfsc STATUS,Z
        goto break ;1月分出力完了で抜ける

        decfsz dowcnt,F
        goto dayoutloop ;日ループ

        movlw .7
        movwf dowcnt
        call newline
        goto dayoutloop ;週ループ
    break:
        call newline

        goto main

    ;### subroutine ###

    ;改行を出力
    newline:
        movlw '\r'
        call tx232
        movlw '\n'
        call tx232
        retlw 0

    ;当該月の日数を返す
    getdaysinmonth:
        addwf PCL,F
        dt .31, .28, .31, .30, .31, .30 ;1~12月
        dt .31, .31, .30, .31, .30, .31
        dt .31, .29 ;閏年1,2月

    #define ADJ .7 ;負にならないよう補正するため
    ;基準の年の当該月1日の曜日を返す
    getfirstdayinmonth:
        addwf PCL,F
        dt 0+ADJ, 3+ADJ, 3+ADJ, 6+ADJ, 1+ADJ, 4+ADJ ;1~12月
        dt 6+ADJ, 2+ADJ, 5+ADJ, 0+ADJ, 3+ADJ, 5+ADJ
        dt 6+ADJ, 2+ADJ ;閏年1,2月

    ;RS232Cで1バイト送信する
    tx232:
        movwf txdat
        bsf GPIO,TXPIN ;start 0
        bsf cnt232,3
    tx232loop:
        rrf txdat,F
        movf GPIO,W
        andlw ~(1<     btfss STATUS,C
        iorlw 1<     movwf GPIO ;write 7+9n
        decfsz cnt232,F
        goto tx232loop
        goto $+1
        goto $+1
        nop
        bcf GPIO,TXPIN ;stop
        retlw 0

    ;RS232Cで1バイト受信し、下位ニブルのみ返す
    rx232:
        btfss GPIO,3 ;start [0,3)
        goto $-1
        movlw 0x80
        movwf rxdat
        bcf STATUS,C
    rxloop:
        goto $+1
        movlw 0x0F
        rrf rxdat,F
        btfss GPIO,RXPIN ;read [9,12)+9n
        bsf rxdat,7
        btfss STATUS,C
        goto rxloop
        andwf rxdat,F
        retlw 0

        end

    おまけで機械語。1ワード(=1命令)が12bitで、16進数にすると3文字という独特の見た目が気に入っている。
        0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    0x 025 CC8 066 006 002 075 078 C59 99E C3F 99E C3E 99E 9AE 211 032
    1x 1F2 9AE 211 1F2 9AE 211 033 403 373 373 1F3 373 9AE 211 1F3 97B
    2x C4D 99E C3F 99E C3E 99E 9AE 211 E01 743 C0A 034 9AE 211 E0F 1F4
    3x 213 643 212 E03 743 A3B C03 094 C0C 703 1F4 313 03A 31A E3F 1F3
    4x 352 E06 0B3 0D4 980 037 0D4 98F 1F3 C07 0B3 603 A4A 1F3 C08 036
    5x 293 0B6 035 97B A5B C20 99E C20 99E C20 99E 2F5 A55 079 C07 1F9
    6x C06 723 0B9 C20 99E 399 E0F 643 C20 743 D30 99E 219 E0F D30 99E
    7x 0F7 643 A79 2F6 A5E C07 036 97B A5E 97B A05 C0D 99E C0A 99E 800
    8x 1E2 81F 81C 81F 81E 81F 81E 81F 81F 81E 81F 81E 81F 81F 81D 1E2
    9x 807 80A 80A 80D 808 80B 80D 809 80C 807 80A 80C 80D 809 030 506
    Ax 578 330 206 EFE 703 D01 026 2F8 AA1 AAA AAB 000 406 800 766 AAE
    Bx C80 031 403 AB4 C0F 331 766 5F1 703 AB3 171 800 --- --- --- ---
    Cx --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---
    Dx --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---
    Ex --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---
    Fx --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- Cxx
      

  • XPはいつまで安全か
    2014年04月09日 01:29

    この文章をWindowsXPマシンで書いているのだが、そのXPのサポートは今日で終了する。
    では今日以降XPを使うのは危険なのだろうか。そうでないならいつまで安全なのか。
    考えてみよう。
    厳密にいえば、「現在および過去のXPと比べ危険になる/なったのはいつか」を考える。
    そうでないと、そもそもXPはサポート期限内でも(7などに比べて)危険である。

    まず、なぜ危険になるのか。
    世の中にはOSのセキュリティーホールを見つけてそれを突く攻撃をする人がいる。
    サポートされているWindowsはセキュリティーホールが見つかればそれを塞ぐパッチが作られWindowsUpdateを通して適用されるが、サポートが切れればそれが無くなるため、危険になるのである。

    では危険になるのはいつか。
    今日サポートが終了するというのは、今日WindowsXPに対する最後のパッチが公開されるという意味である。
    そして、WindowsUpdateは通常1ヶ月に1回行われる。これは言い換えれば、通常は1ヶ月に1回のパッチ適用でWindowsの安全性は十分に保たれるとMicrosoftは考えているということである。
    であれば、今日公開される最後のパッチを当ててから1ヶ月間、あるいはこれは余裕を持った値と考えればそれ以上、WindowsXPは十分に安全であると考えることができる。

    ただし、この考えの大前提は、「今後も今まで同様の攻撃がなされる」ということである。
    今後の攻撃が増える要因が2点ある。

    まず1つに、XP以外のWindowsに対するパッチで修正されるセキュリティーホールがXPにもあった場合、そのパッチを解析することでXPへの攻撃が容易になってしまうという点。
    これを考えると、安心できるのは次に重大なセキュリティーパッチが出るまでということになる。
    来月のWindowsUpdateか、もしかするとその前に臨時に出るかもしれないし、来月のWindowsUpdateが小物ばかりならもう1ヶ月猶予ができるかもしれない。

    次に、既にセキュリティーホールが見つかっている場合、攻撃者は、サポートが切れて修正される危険が無くなってからそれを使った攻撃をするであろうという点。
    これにより、サポート切れを機に攻撃が増えると考えられる。
    さらに言えば、攻撃があってからパッチを作るのには時間がかかるだろうから、実際にはサポート切れの少し前にはもうセキュリティーホールが塞がれる危険性は無くなっているだろう。
    つまり、もうだいぶ前から既に危険であると考えられる。

    しかしゼロデイ攻撃は今までもあったわけで、その程度の危険性なら以前と変わらないとも言える。

    そんなわけでまとめると、悲観的に考えればもう既に遅く、楽観的に考えれば来月のWindowsUpdateまではわりと安全ではないかと思う。
    また、XPをサポートし続けるセキュリティーソフト会社は多いので、XPに何か脆弱性が見つかれば彼らが教えてくれる。何か言われるまではわりと安全であろう。