統計での早期排除
(1)
- まあなんでもいいのだが、たとえばコインの裏表にしよう。表を+1、裏を-1として、1000回投げてみたときの合計の値を考えよう。もしこのコインに異常がなければ、この期待値は0である。
- 今手元にさまざまな形に変形してしまった微妙なコインがたくさんあるとする。これらをコイントスに使えるかどうかの検査をする。コイントスに使えるというのは、結局上記の試行に対して0くらいの数値が出るかどうかということに尽きる(+100〜-100とか)。もちろん本当は1000回くらいじゃ不十分かもしれないし、そもそもそんなコインは処分して普通のコインでトスしろというのが正論なのだが、まあとりあえずこのまま話を進める。
- まああれだ、こんな変な形になってもちゃんとコイントスには使えるんですよ、みたいなサンプルを用意しろ、という課題だという設定にしようか。
- さて1000回ですら不十分かもしれないものの、しかし1枚につき1000回投げるのだって実際にやってみると結構大変だ。1回のトスを2秒でやり終えられるとしても、30分以上かかる。そのうえやってみると、最初の100回くらいで、かなり片方の面に偏って、なんか早くもこれはダメなコインなんじゃないかと思えてくる。そう思えてくるとすごくやる気がなくなる。それでも念のためにあと900回投げるべきなんだろうか。仮に100回の時点で見切りをつけることが許されるのだとしたら、それはいくつくらいを判断基準にするべきなのだろうか。
- という問題に対してそれなりに使えそうな経験則を見出したので、メモしておく。自分でなんとなく見つけたので、これがなんという定理に相当するのかは知らない。
(2)
- 今の場合理想的な合計が0なので僕の経験則には当てはめにくい。そこで1と0にする(1と0にしない場合の計算方法はまだ分からない)。こうすると1000回での期待値は500である。+100〜-100というのに相当するのは、450〜550だろうか。100回というのは、1000回の0.1倍であるので、これを自乗して許される合計の下限を乗じる。そうすると、4.5という数字が出る。・・・これはどういうことかというと、100回投げた時点で、片方の目が4.5回未満(=4回以下)なら、もうこれは合計450になる望みはほぼないと思って除外してしまっていいということである。
- しかし100回のうちの10回くらいしか表が出ない場合だって、十分にうさんくさい。僕のこの経験則はかなり神経質なので、これくらいではまだあきらめずに続けるべきだと命じる。・・・さて200回までやった。まだ19回しか表が出ない。いよいよあやしいではないか。これでもまだ続けるべきなのか。よし、また基準値を計算してみよう。0.2倍の自乗に450を乗じると、18とでる。つまり18未満(=17回以下)ならあきらめていい。ああ、19は18未満ではないのでまだあきらめられない。
- でも10回と4.5回の比較よりは基準がゆるくなってきた。そう、この経験則では、試行回数が上がってくると、それなりに精度が上がってきたと見なして、基準がゆるくなる。・・・ということで300回まで来た。32回だった。さあいよいよここであきらめてよくなるのか。0.3^2*450=40.5。だから40.5回未満はここで打ち切っていい。ああよかった。これで残りの700回を省略できる。
(3)
- この経験則はたぶん完全ではない。たとえば最初の一回で裏が出たとしよう。つまり表が出た回数はまだ0回だ。そしてさっきの式で計算すると、0.001^2*450というのは、1より小さいものの、0よりは少し大きい。つまり、これはあきらめていいということになってしまう。・・・もちろんたった一回程度であきらめていいわけがない。
- この不備を修正するとしたら、0.001^2*450-1とするべきだろうか。つまり常に1を引く。それで、未満をやめて以下にするとか。うん、これでいいかもしれない。
こめんと欄