統計学の致命的な功罪

はじめに

統計学は数学であり理性であり科学理論であると言われる。しかし、本当に真実を求める科学者は統計学が理論にもとづかないことをサポートし、しばしば悪用されることを知っている。例えば、関連の有無を調べるカイ二乗検定で「関連なし」と出たとしても、条件を細分化し、グループを細分化していくと、ある条件下では「関連あり」と出る。つまり綿密な調査をすればするほど関連性はみつかるが、条件を指定せずにおおざっぱに調査をすれば関連性がみつからなくなる。このように調査がおおざっぱで条件を指定しない、そして仮説の立て方の思慮が浅い研究者ほど有意差を見つけることができない。しかし、有意差がない場合に「関連がない」と断言できてしまうのが統計学の功罪である。この功罪のおかげでどれほどの嘘が世の中に出回ってしまうか?その例を上げて解説する。この手の論文が現存する医学論文を全否定できるほど破壊的であることは理解している。私はこうして医学にケチをつけるつもりではない。統計学は証拠として用いてはいけない学問であるということを再度確認するためにこうして例をあげている。その上で、医学を真摯に研究して行こうと述べているのみである。

おおざっぱすぎる仮説の立て方

ある、カイロプラクティックの専門学校でストレートネックと肩こりの関連を調べた。学生200名の頸椎のレントゲン写真でストレート(後弯)ネックあり群となし群の2群に分け、それぞれ「現在、肩こりがあるか?」について調査した。
  ストレートネックあり ストレートネックなし
肩こりあり 21人 47人
肩こりなし 39人 93人
途中の計算は省くがこれをカイ二乗検定で「肩こりとストレートネック」の関連を調べると有意差なしとなる。この結果を元に、研究者は「ストレートネックと肩こりは無関係である」という論文を発表した。この研究発表が真実か嘘か?あなたはどう考える? 統計学的に「有意差がない」ことが証明されたわけであるから、これを立派な科学的Evidenceとしていいのだろうか?

賢明な研究者の綿密なる調査

一方、賢明な研究者はストレートネックの種類から調査し始めた。彼は「健常者でも頭を下向きで撮影するとストレートネックとして映ってしまう」ことを考え、まずは頭蓋底の角度を測定し、これが10°以下で映っている「うつ向き」の人を調査対象から外した。なぜならば同一条件下での撮影ではないからだ。条件が違うのであればデータは正確さを失う。また重心から大きく外れている写真がないように全員の重心測定のもと、姿勢をとりなおして全員を研究者自らが撮影し直した(実際にこのくらいしなければ、研究材料にならないが、カイロプラクターには撮影する権限がない)。
次に「現在肩こりがあるかどうか?」を調査するのではなく、過去にわたって肩こりの様々な症状を調査することにした。頚痛や肩こりで医者に通院した過去があると10点、1週間のうち肩こりが何日あるか?で一日1点、肩に湿布をはったことがあるなら3点、吐き気や頭痛の経験があるなら3点というように点数化して行き、10点以上を肩こりあり、10点未満を肩こりなしという群に分けた。
さらに一日に読書やゲーム、パソコン作業など下を向く時間の合計でグループを3グループに分け、そのそれぞれのグループでストレートネックと肩こりの有無の関連を調べた。すると各グループの全てで肩こりとストレートネックの関連に有意差が認められた。賢明な研究者は「ストレートネックと肩こりには密接な関連がある」と発表した。

どちらが正しい?

さて、ストレートネックの厳密な定義も考えず、綿密なアンケート調査もせず、乱暴にデータをとると「関連なし」となり、綿密な定義づけ、綿密な条件下にグループ分けをするとその全てで「関連あり」となったこの二つの論文のどちらをあなたは信じるか?数学的に科学的にどちらも正しい。これが統計学の功罪である。

条件の細分化には果てしない労力と深い思慮が必要

統計学は仮説の立て方、グループの分け方、条件と定義などにより関連性がありと出たりなしと出たりする。皮肉としか言いようがないが、非常におおざっぱで楽な作業でグループ分けし、何も考えずに適当に行えばデータのほとんどが「関連なし」となり、綿密に思慮深くした場合にのみ「関連あり」と出るのが統計学である。「関連あり」という証拠を導き出すのには、一生かかるような研究者の努力が必要で、「関連なし」という証拠を導き出すには3分あれば十分なのである。しかし、どちらも科学が証明した証拠として扱われることが間違っている。

関連なしのデータは基本的に信用性ナシ

さて、統計学が悪用されるのは、製薬会社の副作用の調査でもっともさかんである。
  • この薬を服用した者と悪性腫瘍にかかった者
  • この薬を服用した者と肺炎で死んだ者
たとえばこういう致命的な関連を証明するには血のにじむような長年の調査研究が必要である。しかしながら、「関連なし」とするには3分でOKである。例えば、調査期間を薬を服用して1年にしてしまえば、悪性腫瘍になる者はゼロ、肺炎で死亡した患者もゼロ、よって「薬と死には因果関係なし」という論文になる。
この手の「関連なし」の論文は、おおざっぱに、思慮浅くすればするほど有意差が出なくなる。一方、100年かけて長期で副作用を研究し、遺伝子、生活習慣、食事、貧困、睡眠時間などを条件下にグループを細分化すれば「関連あり」となる。少し考えればわかるが、製薬会社が、自社の薬の副作用を調査する際に、条件を細分化したり100年かけて調査したりすることはない。もしも悪意があれば、「関連あり」と出てしまったデータも、条件や分類をおおざっぱに戻せば「関連なし」という結果に直すこともできる。真実を言うと、「関連なし」という結論を導くためには「関連あり」の条件よりもさらに分類を細かくし、思慮深く理論を組み立てなければ結論を出してはいけない。そのためには5年や10年の期間では無理であり、グループ分けも何十通りにしなければならない。
私はこうした関連なしの論文をいつも殺人犯の犯人捜しに例えている。容疑者が上がってもずさんな捜査であれば「関連なし=無罪」となる。しかし、容疑者を無罪にしてしまうと、警察の威信が落ちてしまうので警察は容疑者と殺された被害者の関係を死に物狂いで探し出そうとする。しかし、それでも「何の関連もないときに限り無罪」となる。つまり、無罪とするには死に物狂いの捜査が必要である。しかし、一般的には科学者はその逆である。ろくに調べることなく簡単に「関連なし」の論文を書く。だから「関連性は認められなかった」の論文は基本的には信用に値しない。

統計学の悪用に注意

私はもともと統計学がこのような致命的な欠陥を持ち得ていることを知っている。よって「関連なし」のデータはそもそも信用していない。しかしながら、製薬会社の副作用のデータなどには「あきらかな関連なし」という言葉がそこらじゅうにちらばっている。まさに統計学が悪用されている。科学自体がここまで茶番であるから、私たちは科学をうのみにしてはいけないことをきもに銘じておいた方がいい。教授が言うから大丈夫、アメリカで大丈夫だから大丈夫…は通用しない。

統計学で関連ありの場合も信用できない

統計学では少数派が無視されるということが起こる。これは「医学論文の過ちと限界」を参。以下、未完成。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です