川合秀実による新型コロナウイルスの累計感染者数の予測について #1
(0) この文章の目的
- この説明書きは、私が2020年の3月の中旬ごろに始めた、「新型コロナウイルス 予測」のページの内容について、説明が不十分ではないかという指摘を受け、それは全くその通りだと思ったので、書くことにしたものです。
(1) この予測の目的について
- 私は「フェルミ推定」が好きです。これは少ない手がかりから何らかの概算値を得るための考え方です。
- そんな私が、毎日発表される感染者数から、今後の感染者数を予測できないだろうかと考えました。・・・つまりここでされている予測はその程度のものであって、何かまともな裏付けがあるわけではありません。私は医学や病理学、感染症にかかわる一般的な知識を持っているわけではありません。その程度の人間が、簡単な計算で適当な推測をしているにすぎません。
- 誰かが自分の判断のためにこの予測値を使うことを私は妨げません(まったくおすすめはできませんが)。しかしそれは全面的に「自己責任」で行ってください。
- ここに私の予測の根拠をすべて書きますので、それでどう思うのか自分で判断してください。また過去の予測がどのくらい当たったのか当たらなかったのかも明らかにしますので、それも自由に参照してください。私は一切保証できません。
- 私自身は、この予測が当たらなかったときに「やっぱり」こんな方法ではダメだったかー、くらいにしか思わないので、この予測を人生を左右するような判断のために使うことはしません。
- またこの予測は私が個人で行っているものであり、私の所属する組織の意見を反映したものではありません。
- こんなに予防線を張らなければいけないのなら、わざわざ公開なんかしなければいいじゃないかと思われるかもしれません。・・・しかし一方で私はこの予測がとても参考になると思っていて、そのように感じる人が他にもいるかもしれないと思っています。そのために公開しています。
- 私のこの予測は、「もし感染にかかわる前提条件が今と変わらなければ」という仮定の下で成り立っています。だからこのままいけばこうなるかもしれないというだけで、実際はこのままではないことのほうが多く、だから当たらないわけです。しかしそれでも「あの時のままだったらこうなったかもしれない」ということが推定できて、それと実際の値を比較(引き算)することで、活動自粛にどのくらいの効果があったのかを感じることができると思っています。私はそれを見て、活動自粛のはげみにしていました。
- そもそも臨時休校の直後にこの予測を始めたことからして、臨時休校によるよい効果がきっとこれからどんどん出てくるに違いない、それを自分の目で見て実感しよう、きっとそれは楽しいに違いない、それが動機でした。
- しかしその後、収束期ではなく再拡大期に入ってしまい、そうなると「このまま何もしないと結構大変なことになる」ということが見えるだけになってしまい、つらくなってしまいました。それでも、前もって計算しておくことで、実際にそうなっても動揺を小さくする効果はあって、それが私にとっては有益でした。
(2) 計算方法
- (2-1)私はできるだけシンプルに予測をしたいと考えました。私が簡単に入手できるのは、日本全国での感染者数のデータです。それ以外の情報は、私の手に余ります。だからこの感染者数だけで何ができるのか、それだけを考えました。
- ・・・感染者数のうち、感染経路がわかったものとわからないもの、クラスターで感染拡大したものとそうではないもの、それらの情報も加味して集計できれば、より高度な分析ができそうですが、専門的な知識を持たない私はそれらをどのように扱うべきかわかりません。だからそれらは一切区別せずに、あえて同じものとして扱っています。これは近似だと思っています。
- (2-2)まず1週間ごとの新規感染者数を計算します(以降これを説明の便宜のためにB値と称します)。ニュースでは1日ごとの新規感染者数が報道されますが、これは曜日によってかなり増減があり、増えているのか減っているのかわかりにくいように思ったためです。1週間ごとに集計すれば、曜日の影響はなくなります。最近では直近7日間での平均の新規感染者数を指標にしている自治体もありますが、それとB値の違いは単に7で割るか割らないかの違いです。
- (2-3)そしてそのB値が、先週と比べて何倍になったのかを調べます(以降これを説明の便宜のためにC値と称します)。これは企業業績などを評価する際に、前年比1.5倍とかをやりますが、つまりそういう計算を週ごとにしているだけです。C値が0.5など1未満になってくれれば、感染は収束に向かっていると考えます。逆に1以上であれば、感染拡大が続いていると考えます。・・・C値がこの先数週間くらいはほとんど変わらないと仮定すれば、1週間後、2週間後のB値が簡単に計算できます。そこから累計感染者数を算出することもできます。これが私の予測です。
- (2-4)この予測方法には、新型コロナウイルスがどのような病気で、どのように感染していくのか、それにたいして私たちはどのように応じていくのか、などの要素を全く含んでいません。ただ引き算して割り算して、倍率をみているだけです。
- そのために高度な予測はできません。緊急事態宣言が出たり大型連休に入ったりすれば、C値は大きく上下して予測が当たらなくなります。しかし一方で、社会情勢が大きく変わらない時期は、この予測は(単純さの割には)かなりうまくいっているように思います。ですから、このままだとこうなりそうだ、ということがわかります。
- (2-5)ここまでの説明で、週ごとの予測は説明できていますが、日ごとの予測は説明できていません。
- たとえば本日火曜日の予測値を得たいときは、先週の火曜日の新規感染者数にC値を乗じて、それを新規感染者数の予測値としています。
- ・・・なぜこの計算にするのかというと、先週の新規感染者数の和は先週のB値であり、今週の新規感染者数の和は今週のB値です。1週間でB値はちょうどC倍になるという仮定でやっているわけですが、新規感染者数がそれぞれC倍になれば、B値も自動的にC倍になることになるので、他の仮定と矛盾なく整合性が取れるためです。
- これはつまり、先週の曜日ごとのB値への寄与割合を維持して、予測した新しいB値から分配していることになります。
(3) C値が一定値をとるという仮定について
- この予測のうちで最大の仮定は、予測対象期間内はC値が変動しないというところだと思っています。なぜそんな仮定をすることにしたのかを説明したいと思います。