統計での枝狩り
(1)
- まあなんでもいいのだが、たとえばコインの裏表にしよう。表を+1、裏を-1として、1000回投げてみたときの合計の値を考えよう。もしこのコインに異常がなければ、この期待値は0である。
- 今手元にさまざまな形に変形してしまった微妙なコインがたくさんあるとする。これらをコイントスに使えるかどうかの検査をする。コイントスに使えるというのは、結局上記の試行に対して0くらいの数値が出るかどうかということに尽きる(+50〜-50とか)。もちろん本当は1000回くらいじゃ不十分かもしれないし、そもそもそんなコインは処分して普通のコインでトスしろというのが正論なのだが、まあとりあえずこのまま話を進める。
- まああれだ、こんな変な形になってもちゃんとコイントスには使えるんですよ、みたいなサンプルを用意しろ、という課題だという設定にしようか。
- さて1000回ですら不十分かもしれないものの、しかし1枚につき1000回投げるのだって実際にやってみると結構大変だ。1回のトスを2秒でやり終えられるとしても、30分以上かかる。そのうえやってみると、最初の100回くらいで、かなり片方の面に偏って、なんか早くもこれはダメなコインなんじゃないかと思えてくる。それでも念のためにあと900回投げるべきなんだろうか。仮に100回の時点で見切りをつけることが許されるのだとしたら、それはいくつくらいを判断基準にするべきなのだろうか。
- という問題に対してそれなりに使えそうな経験則を見出したので、メモしておく。自分でなんとなく見つけたので、これがなんという定理に相当するのかは知らない。
(2)