計算ができることよりも大事だと僕が思うこと

  • (2007.10.07)

(1)

  • こんな問題がある:「2つのりんごと3つのみかん、全部でいくつ?」。この問いに対して、かなりの割合の人が「5個」と回答し、しかも違和感を覚えないようだ。ではこの問いではどうだろう?「2台の三輪車と3台のロケット、全部でいくつ?」。
  • ものの個数ということで考えれば、もちろん単純に加算すればいいのでそのとおりだ。でも本当にそれでいいのだろうか。たとえば三輪車の台数とロケットの台数の合計を求めなければいけない状況を想像してほしい。これらを同列に考えていいのか。それはそもそもその問題設定に間違いがあるのではないかと疑うべきではないだろうか。りんごとみかんを混ぜていいのかどうかについてもだ。
    • たとえばりんごとみかんなら「それぞれをひとつずつ紙皿に置くことにする、さて紙皿はいくつ必要か?」という背景があれば納得はできる。でもそれなら、この計算は本当は紙皿2枚と紙皿3枚の計算であって、りんごとみかんの合計ではない。それにもしりんごが特大サイズなら、りんごは半分ずつお皿にのせるかもしれない。その場合は2x2+3=7になる。
    • もしくはたとえば混ぜてフルーツジュースを作るのかもしれない。その場合は絞ったときの果汁の量を加えるべきで、コップ2杯分とコップ3杯分、合わせて5杯分、とするべきだと思う。そもそもみかんはりんごよりも果汁がたくさんありそうで、だから2+3=5ではすまない気もする。
    • このように実際の状況に思いをはせることで、適当に2+3で済ませるよりもより正確な値を導くことができる。
  • でも学校では「○個と○個、全部でいくつ?」は「足し算で計算する」と一方的に教える。それに意味があるかどうかなんて教えない(というか教える・教えない以前に、教師自身もそんなこと考えたことがないのかもしれない)。これは非常に危険なことだと思う。というのは、自分の計算が本当に意味あることをしているといえるのか、それは近似でしかないのか、などについて「考えようともしない」からである。

(2)

  • 聞いた話によると、日経平均株価と東証株価指数の値の関係がほぼ10倍になっているのを利用して、これらを目安に売買して利益を得る資産運用法があるらしい(これは投資ではなく投機になると思う)。僕はこれ自身には興味がないけれど(だからこめんと欄にその手の話題を書かないでほしい)、その中でこんな計算をしている人がきっといるだろうと思ったので例として使いたい。
  • と思ったら、本当に堂々とやっている人がいた。これを見てほしい。
  • ここにあるのは日々の日経平均と東証株価指数の比のチャートで、要するにある種の折れ線グラフだろうと思うのだが、そこに移動平均線というのがある。ここには25週線と75週線があり、多くの投機家はこのグラフのどちらが上になっているかとか、実際の現在の比の値と比べてどうかなどを見ながら、株やファンドの売買をしているらしい。25週線というのは、各時点での過去25週間に渡っての比の平均値を求め、その平均値の変化をグラフにしたものである。
  • さてここで問題になるのは、この平均値がどうも相加平均であるらしいということである。相加平均というのは「普通の平均」で、つまり25週間なら25週間の値を全部足して、それを25で割っただけのものである。
  • 相加平均がなぜ問題なのか、それすら分からないかもしれない。やや極端な具体例を示そう。たとえばこの比が4週間に渡って、2、5、10、20という変化をしたとしよう(本当にたったの4週間でこんなに比が変化したら日本経済は終わりかもしれないけれど)。この4つの数字の平均を相加平均で求めると、(2+5+10+20)/4=9.25となる。なるほど、この4つの数字をじっと見て、その中間値が9.25だといわれると、僕にもそんな気がしてくる。実際、この値は中間値としては問題ない範囲にある。
  • しかし投機家の中には、そもそもこの比を計算するときに、日経平均株価/東証株価指数ではなく、東証株価指数/日経平均株価としている人がいるかもしれない。どっちにしても比であり、どちらかでなければいけないという合理的な理由はない。その人から見ると、この4週間の比の変化は、0.5、0.2、0.1、0.05であって、その平均(相加平均)は0.2125になる。
  • この2人の結果をよく見てほしい。前者の9.25の人の場合、この平均値は5の週と10の週の間の値であって、だからグラフ上ではその辺で実際の値と交差することになるだろう。そのタイミングで売買したと思われる。しかし一方、後者の0.2125の人の場合、この値は0.5と0.2の間だから、交差は違う場所になる。つまり相加平均を使って移動平均を求めると、比を計算するときにどちらを分母にしているかによって、売買のタイミングが変わってくるのだ。そんな本質的ではないことで売買の時期が変わるような分析方法が果たしていいだろうか。少なくとも僕ならそんなやりかたはしない(まあ僕はそもそもこんな投機はしないけど)。
  • じゃあどうすればもっとまともな平均値が出せるだろうか。それは相乗平均を使えばいいだけである。相乗平均は足し算ではなく掛け算を使い、割り算の代わりに根(こん、ルートのこと)を使う。4で割るのに相当するのは4乗根である。とにかくやってみよう。(2*5*10*20)の4乗根=6.6874。(0.5*0.2*0.1*0.05)の4乗根=0.149535。ほらこれなら同じような場所になりそうだ。というか、6.6874の逆数がちょうど0.149535なので、まさに完全に同じ位置になっているはずである。
  • 貴重な自分の財産の一部を賭けているくせに、多くの投機家はこんなことすら考えていないのだろう。それでも利益が出るかもしれないけど、もしかしたらもっとちゃんとすればもっと利益が出るのかもしれない。・・・なお、投機の理論には「正しいか間違っているかよりも、みんながどう思うかの方が重要」というのがあるそうで、つまりどんなに間違った計算法でも、みんながそれを使い、それを売買基準にしている限り、問題はないということなのかもしれない。むしろ相乗平均を使うとかえって利益が出なくなる可能性すらある。
  • 同じことは他にも言える。金と銀の値段の比で似たようなことをやっている人もいるだろう。この場合も深く考えないで相加平均を使ってしまう人がいそうである。
  • この分析方法のほかにも、平均値だけではなく標準偏差も求めて平均からのずれを評価する投機方法があるらしい(ボリンジャーバンド?)。しかし比に対して相加平均を取るのがおかしいのと同じ理由で、これも根本的におかしい気がする。似たようなことをやりたいのなら、比の値をそれぞれの適当な底で対数化して、それで相加平均でも標準偏差でも出せばいいだろう(対数で相加平均を求めることは、対数化しないままで相乗平均を取るのに等しい)。

(3)

  • グラフもひどいのが多い。しかもこれについては小学校で習ったのにそれすら守ってないものもある(少なくとも僕は習った)。特にひどいと思うのは、折れ線グラフを使うべきとされている状況で、なぜか棒グラフを使うことである。
  • たとえば各国の人口をグラフにするときは、日本、アメリカ、イギリス、・・・と棒グラフにするのが基本である。世界の総人口に対する割合も見せたいなら円グラフか棒グラフの内分だろう。そして、たとえば日本の人口の移り変わりを示したいのなら、折れ線グラフにするべきだ。それなのになぜか棒グラフにする人がいる。そういう変なグラフをかいた人にその場で聞いたら、そのほうが「絵になる」とか「かっこいい」とか言っていたが、僕はそれには大いに失望した。折れ線ならその線の傾きが見えて、今後の増加傾向や減少傾向を推測する手がかりも得やすいのに、棒だと補助線を引いたりしないと分かりにくい。本来は数値の羅列を分析しやすくするためのグラフ化のはずなのに、そんなことを忘れてしまい、適当な動機で不適切なグラフをかいてしまう。実に嘆かわしい。僕なんか(ひねくれているせいかもしれないけど)、そういう不適切なグラフを見ると、さては正しいかき方ではなにか不都合なことがあって、それを隠すために不適切なグラフを選択したんじゃないかと疑うことがあるくらいである。

(4)

  • グラフといえば、もっとすごいテクニックがあった。たとえば○○は△△とくらべて、こんなにビタミンが豊富です、みたいなことをいって、グラフを出す。なるほど、一見すると10倍くらい違うように見える。しかしもっとよくみると、そもそもグラフの原点が0ではない。数値的に比較したら、その差は3%くらいだった、なんてわけだ。差があることそのものが重要な場合があるけど、それならその従来品の値を原点に据えて、そこから+なにがしとかけばいい。それを作為的なところに原点を設置するというのはかなり悪質で、「だまそう」という強い意図を僕は感じる。
  • こんなバカをやっているのは、何も悪徳商法のコマーシャルだけではない。なんとOSASKがお世話になっているsourceforge.jpまでもがやっている。
  • このグラフはなんなのだ、なぜ原点が0じゃないのか。仮にアクセス数が10000〜10010の間でうろうろするプロジェクトがあったとしたら、そのグラフはアクセス数が0〜10の間でうろうろしているプロジェクトとほとんど違わないものになってしまう。しかし意味は全然違うじゃないか。10000が10010になったところで、それは0.1%の増加でしかない。原点が0のグラフをかけば、きっとただの横棒になってしまうだろう。それじゃあ増えているのか減っているのかわからないのでよくないと言うのだろうか。しかし僕にいわせれば、つまりその程度の増減であればそれは「増減していない」といっても過言ではないわけで、つまりそんなノイズみたいな変動に振り回されてサイトデザインを見直したりなんかしたら、もうめちゃくちゃなことになると思うのだ。・・・ということで、これは混乱を招くだけのグラフになっている。しかしきっと悪意はないのだろう。無知すぎるだけなんだろう。

(5)

  • そもそもただ出てくる数字を足すだけでよければ、そんなのは人工無能でもできる。ただグラフをかけばいいのならバカの一つ覚えで棒グラフを描くソフトを作ることだってできる。でもそんなのは「計算」でも「情報処理」でもないことを分かってほしい。しかも分かってないくせに、分かったふりをして、正しいことをやろうとしている人の邪魔をしないでほしい。
  • なんとなく内容が関連: boyaki_a/0022

(6)

  • いつか書くかもしれないネタ。
    • 10℃の水に20℃の水を「足して」も30℃にはならない。20℃になるともいえない。
    • 平均気温は湿度などによる比熱を考慮すべき場合もあるのでは。
    • 濃度も同じ。
    • 安易な平均は近似でしかなく、その近似値が前回よりもほんのわずかに増えたとか減ったとかで一喜一憂する人がいるけど、それは実はほとんど意味ない。

こめんと欄

  • おもしろいですね。わかりやすい。 -- くーみん 2007-10-15 (月) 03:00:46

コメントお名前NameLink

リロード   新規 編集 差分 添付   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS
Last-modified: 2007-10-15 (月) 03:00:46 (5412d)