第1章 | なぜ統計学が最強の学問なのか? |
01 | 統計リテラシーのない者がカモられる時代がやってきた |
| H・G・ウェルズの予言/あみだくじの必勝法/統計学を制する者が世界を制する |
02 | 統計学は最善最速の正解を出す |
| 統計学が最強の武器になるワケ/「疫学の父」ジョン・スノウの活躍/人類の寿命は疫学が伸ばした |
03 | すべての学問は統計学のもとに |
| 「エビデンス」が医療を変えた/教育にも活かされるエビデンス/野球にも経済学にもおよぶ統計学の影響 |
04 | ITと統計学の素晴らしき結婚 |
| なぜ今、統計学が花開いたのか/フラミンガム研究の調査が2年に1回だったわけ/退屈だった「紙とペンの統計学」/「ビッグデータ」という言葉が流行るわけ/これからの10年で最もセクシーな職業 |
第2章 | サンプリングが情報コストを激減させる |
05 | 統計家が見たビッグデータ狂想曲 |
| 狂想曲を盛り上げる専門用語/データを活かすのにお金は要らない |
06 | 部分が全体に勝る時 |
| 失業率25%!/ニューディール政策を支えた統計家たち/全数調査vsサンプリング調査/80年前と変わらないおっさんたち |
07 | 1%の精度に数千万円をかけるべきか? |
| サンプリング調査への「よくある反論」/誤差を計算する方法/サンプルを1万増やしても標準誤差は0・3%しか変わらない/まずは、正しい判断に必要な最小十分のデータを |
第3章 | 誤差と因果関係が統計学のキモである |
08 | ナイチンゲール的統計の限界 |
| 「ふ〜ん」としか言えないグラフ/データをビジネスに使うための「3つの問い」/「集計」だけでよかったのは19世紀まで |
09 | 世間にあふれる因果関係を考えない統計解析 |
| ツッコみどころが多すぎるグラフ/よくわからないまま使われる指標たち/死者・犯罪・暴動を生み出す食べ物とは? |
10 | 「60億円儲かる裏ワザ」のレポート |
| 買ってくれる人、買ってくれない人の違いは何か?/「あるある」は当てにならない/DMの送り方を変えるだけで売上が60億円アップする |
11 | p値5%以下を目指せ! |
| 「誤差」を考えない試算は皮算用/「A/Bテスト」とはお馴染みの比較検討のこと/「0.1%」の差は出たけれど/「カイ二乗検定」と「p値」の登場 |
12 | そもそも、どんなデータを解析すべきか? |
| 裏ワザを見つける3つめのポイント/ビジネスにおける明確なゴール/それは利益につながっているのか?/CPU温度の解析がコスト削減につながった |
13 | 「因果関係の向き」という大問題 |
| 因果関係には向きがある/ゲームと少年犯罪の因果関係は明らかにできるのか?/「フェア」じゃないからわからない/2つの解決法 |
第4章 | 「ランダム化」という最強の武器 |
14 | ミルクが先か、紅茶が先か |
| 「科学」の対象を拡大したランダム化比較実験/なぜ、ランダムでなくてはならないのか?/「1杯の完璧な紅茶の淹れ方」/オカルトとペテンの見破り方/研修やDMの効果測定にも |
15 | ランダム化比較実験が社会科学を可能にした |
| 科学は「観察」と「実験」からなる/「誤差」あるものの科学/「誤差」への3つのアプローチ/『実験計画法』は農場で生まれた |
16 | 「ミシンを2台買ったら1割引き」で売上は上がるのか? |
| 「攻め」のための統計学/「誤り」と決めつけることの愚かさ/1億5000万ドルを稼いだクレーム対応/ランダムは意外とむずかしい |
17 | ランダム化の3つの限界 |
| 「現実」の壁/「倫理」の壁/「感情」の壁 |
第5章 | ランダム化ができなかったらどうするか? |
18 | 疫学の進歩が証明したタバコのリスク |
| タバコの箱を見てみよう/「ケースコントロール研究」の登場/天才フィッシャーからの反論/世界中のデータによる再反論/「揃えきれていない条件」にどこまでこだわるべきか |
19 | 「平凡への回帰」を分析する回帰分析 |
| 回帰分析とは何か/背の低い野村くんの恋愛/ダーウィンの従兄弟と優生学/「平凡への回帰」の発見/「オリンピックの魔物」の正体 |
20 | 天才フィッシャーのもう1つの偉業 |
| ゴルトンの回帰分析の限界/回帰係数自体にバラつきがある/統計学者も理解できなかった「真値」というアイディア/回帰分析を使うための基礎用語 |
21 | 統計学の理解が劇的に進む1枚の表 |
| 統計学の教科書は一般化線形モデルの扱いで2種類に分けられる/「1枚の表」の使い方/どの方法でも同じp値が得られるわけ/紛らわしい用語「一般線形モデル」 |
22 | 重回帰分析とロジスティック回帰 |
| 学者も多用する統計手法の主役/フェアな比較が崩れるシンプソンのパラドックス/層別解析でパラドックスは防げるが……/層分けを不要にする重回帰分析/オッズ比を用いるロジスティック回帰/回帰分析が読めれば「いいかげんな言説」が駆逐できる |
23 | 統計学者が極めた因果の推論 |
| 回帰モデルを使う際は交互作用に注意する/ドツボにはまる変数選択作業/限りなくランダム化に近づく「傾向スコア」 |
第6章 | 統計家たちの仁義なき戦い |
24 | 社会調査法vs疫学・生物統計学 |
| 統計学の6つの分野/正確さを追求する社会調査のプロたち/「妥当な判断」を求める疫学・生物統計家/終わりのない言い争い |
25 | 「IQ」を生み出した心理統計学 |
| 「一般知能」の発明/知能を7つに分けた多因子知能説/心理統計家の考え方と手法/心理統計家は「質問紙」に命をかける/IQへの結論 |
26 | マーケティングの現場で生まれたデータマイニング |
| 意外なほど新しいデータマイニングの歴史/「おむつとビール」でバスケット分析/バスケット分析よりもカイ二乗検定を/人工知能の研究から生まれた高度な手法/なぜ、データマイニングの専門家は回帰モデルを「古臭い」と言うのか?/「予測」に役立つデータマイニング |
27 | 言葉を分析するテキストマイニング |
| 計量文献学が否定した「シェイクスピア=ベーコン説」/テキストマイニングの王道「形態素解析」とGoogleを支える「N-Gram」/ビジネスにおけるテキストマイニングの活用法/テキストマイニングを活かすコツはそれ以外の統計リテラシー |
28 | 「演繹」の計量経済学と「帰納」の統計学 |
| 統計学と計量経済学の「表面的」な違い/統計学と計量経済学の「本質的」な違い/よりよいモデルを求める計量経済学者/影響力を強める計量経済学 |
29 | ベイズ派と頻度論派の確率をめぐる対立 |
| 頻度論派はシンプルに考える/ベイズ派は「事前確率」と「事後確率」を考える/計量経済学と相性がいいベイズ統計/迷惑メールの判別に威力を発揮するベイズ統計 |
終章 | 巨人の肩に立つ方法 |
30 | 「最善の答え」を探せ |
| エビデンスのヒエラルキー/最高のエビデンス「系統的レビュー」と「メタアナリシス」/「最善の答え」は公開されている |
31 | エビデンスを探してみよう |
| 日本語文献の探し方/英語文献の探し方/明らかになる課題 |
| |
| おわりに |
| 参考文献 |
| 索引 |
|