「統計学は最強の学問である」(西内 啓著)は、35万部のベストセラーとなったが、その続編として具体的な手法を紹介した実践編がでた。著者は、生物統計の専門家であるが、遺伝子から政策に至るまで、ありとあらゆる分野の横断的な課題に関する実データ解析の体験を持っている。本書では、統計学を使って、人間の行動や社会的状況を洞察し、その行動を少しだけ改善するための手法を紹介するとある。データサイエンティスト、ITによるビッグデータの解析が喧伝されているが、日々、現場の感覚を養いながら、統計リテラシーを身に付けた本人が、データから価値を見出す方が大きなアドバンテージがある。多くの人に統計学を活用してもらいたい。
内容は、平均値と標準偏差、統計的仮説検定、回帰分析、因子分析とクラスター分析、について、ケトレー、ガウス、ピアソン、フィッシャーの原点を紹介しつつ判りやすく解説している。(0,1)データを出力とするロジスティック回帰分析を紹介しているが、対数オッズ比は、実験計画法のΩ変換と同じものであることを改めて確認できた。一般化線形モデル等、さらなる手法の紹介もあり、統計学を判り易く理解してもらうためにも初心に帰り勉強したい。
そして、同じ著者による「1億人のための統計解析」は、実データを使った解析例によって、前著の考え方を実証するものである。著者が、統計学を勉強した時代は、パソコンが手元で活用でき、エクセルによる解析の宿題が課せられたという。統計学の習得には道具として使ってみることが手っ取り早い。ビジネスデータによるケーススタディで、エクセルによる解析手順と解析結果の解釈の仕方を解説している。パソコンを使ってグループで勉強するとよいだろう。
中心は、重回帰分析であるが、解析の進め方として、①アウトカム(ビジネスの利益につながる、目的変数に相当するもの)、②解析単位(Who、When、Where、What、Howに相当する、人毎、商品毎、日毎と数十から数百のサンプル)、③説明変数(アウトカムに関連があり、当たり前でないもの、解析単位が違いを生みだす特徴)を紐づけして用意する。事例では、説明変数を結合して新たな説明変数をつくる(例.量でなく率にする)、質的データをダミー変数にするといったノウハウが紹介されている。そして、解析結果からの活用として、結果からアイディアを発想するために、①説明変数を変化させ、アウトカムがどう変化するか、説明変数を層別すると、どう変化するか、天候等の動かせない説明変数は予測して最適化すること、からヒントを得ることができる、②儲かりそうなアイディアが見つかったら、ランダム比較実験、A/Bテストで検証する。これからは、仮説検証ではなく、記録されている実稼働データ、調査データを使って、アウトカムと説明変数の関連性を探索して価値ある知見を発見するのが有効である。
さらに、「週刊ダイヤモンド(1/31)」で、統計学の特集がでた。西内氏の2書の要約、すかいらーく、カルビー、エステー、JR東日本等の活用の成功例、そして統計の達人のノウハウが紹介されている。面白かった事例を一つ紹介する。笑点の視聴率が高いとGDPの増減率が下がるというデータがある。なぜか。笑点の放送時間は、日曜5時半からである。日曜日にテレビを見ているということは、外出していない公算大で、景気が悪く所得が増えない、と読める。
日本のビジネスマンが、当たり前のようにデータ解析を活かせるようになれば、日本全体の国際競争力の資源になる、というのが西方氏の主張である。
現場のQCサークル活動で、QC7つ道具が活用されているように、ビジネスマンの間で統計学が広く活用されるようになることを願っている。 (杉山 哲朗)