トリック

図1. 基本図.

昔、占いの当り外れについて書いたことがあったが、あのとき書かなかった占い師がよく使うトリックについて話をしておこう。

図1は以前書いたものと同じ図*1で、図の緑色と水色の部分が占った結果の集合、青と水色の部分が当てるべき現実の集合をしめしている。当然当てるべき現実と占った結果の共通集合が占いが当てた事象の集合ということになる。

占った結果の集合をF、現実をR、当りをHとすると上の記述は、

\large H = F \cap R

でしめされる。ここで占いの当り外れの尺度として再現率(recall)と適合率(precision)の2つがある。

\large recall = \frac{n(H)}{n(R)}
\large precision = \frac{n(H)}{n(F)}

さて「オレの占いは当たる」と自己申告する連中の占いは以下のどちらかであることが多い。

■■■
図2. 再現率重視.■■■図3. 適合率重視.
一つは再現率を重視して、占いの結果の集合Fを拡大していくタイプ、もう一つは適合率を重視してFを縮小していくタイプだ。再現率を重視してFを拡大すれば当然Hも大きくなっていく。そこで「オレはこんなことも当てたんだ」とエバルわけだ*2。しかしこのタイプはFを無理やり拡大しているわけで適合率はかなり低いが、そのことについてはダンマリを決め込む。

適合率重視型はFを小さくすることで適合率を上げる。そして「オレの占いはこんなに外れがない」とエバル。当然、再現率は小さいがやはりそのことについてはダンマリを決め込む。つまりFRの設定を都合よく選ぶことで、「統計的にもオレの占いは当たる」と自称することはそんなに難しい話ではない。

主観を外して学として占いの当たり外れを検証するとすれば、以前書いたようにFRをYes/Noクエスチョンに制限して検証するしかないだろう。この場合のみ再現率と適合率は同じ値をしめして、当たり外れの割合が確率として意味を持ってくる。

*1:左右が逆だが。

*2:エグイ奴だと占った後でRを操作してHを大きくする。