ベイズ統計学 | 一般社団法人 中部品質管理協会

一般社団法人 中部品質管理協会は、品質管理を中心とする管理技術・マネジメント手法を教育・普及する専門機関です。QC検定®対応講座も開催しています。

ホーム > ベイズ統計学

私たちがQC手法として学んできた統計学は、ピアソン、ネイマン、フィッシャー等による頻度主義によるものである。例えば、仮説検定は、仮説がデータにどれくらいあてはまるかを確かめるもので、判断の基礎として用いている。それに対して、「経験に学ぶ」、すなわち、最初の考えを新たな客観的な情報に基づいて更新すると、それまでより質の高い知見が得られる、という主観主義によるベイズ統計学がある。
 「異端の統計学ベイズ」は、ベイズ統計学の歴史を紹介する書である。1740年代、牧師ベイズがその法則を発見し、数学者ラプラスが定式化したとされる。しかし、あいまいな常識の介入を避けた先の頻度主義の統計学者たちによって、200年間、抹殺されてきたのである。その後、第2次大戦でチューリングがドイツ海軍の暗号解読に使ったことが認められ、さらに、アメリカの労働保険システムの構築、ロシアの潜水艦探索、原子力発電所の安全性予測、喫煙と肺がんの関係の分析、さらには、経営における意思決定と、ベイズ統計学が実際の世界で活用されてきた。ベイズ統計学の考え方が、人間の自然の思考に沿っているし、現実のデータの変動を上手く表現してきたからである。そして、21世紀になって、コンピュータの発展により、ベイジアンネットワークやマルコフ連鎖モンテカルロ法の計算が容易になってきたことで、金融、物理学、天文学、遺伝学、軍事行動やテロ予防対策、音声認識、機械翻訳と、広い分野で活用されるようになってきている。カーナビはベイジアンネットワークによる技術である。物理学、天文学、遺伝学では、「干し草の中から針をさがす」といわれる多くの未知数の中に埋もれているあいまいな現象の研究に活用されている。
 ベイズの定理は確率・統計の本では1ページ程度にしか紹介されていないが、「史上最強図解、これならわかるベイズ統計学」では、繰り返し事例を使って定理を判り易く解説し、最近の活用についても紹介している。さらに、「リスク・リテラシーが身につく統計的思考法」の本では、医療の検診やDNA鑑定の例を取り上げ、確率・統計データを見る場合の陥りやすい誤りを指摘している。
 ベイズの展開公式とその計算例を以下に示す。
P(病気)=0.008、P(陽性|病気)=0.90、P(陽性|病気でない)=0.07 とすると、検査で陽性(病気と判定)と診断された時、病気である確率は、
P(病気|陽性)=0.008×0.90/(0.008×0.90+0.992×0.07)=0.094
 これを頻度に置き換えて計算すると理解しやすい。1000人の人がいるとすると、病気の人は8人(1000×0.008)で、その中、陽性は7人(8×0.9)、陰性は1人であり、病気でない人は、992人で、その中、陽性は70人(992×0.07)、陰性は922人(992×0.93)である。従って、P(病気|陽性)=7/(7+70)=0.091 となる。
 学生に対する訓練結果では、確率計算による訓練より、頻度による訓練の理解度が高いと出ている。他の場合でも、このように一度限りの出来事の確率は、確率よりも頻度による示し方の方が誤解を避けることができる。
 ベイズ統計学は、試験・評価における判断等、QCでも有効であると考えられる。まだまだ勉強しなければならないことがある。          (杉山 哲朗)