試験で 72 点を取った。クラスの平均は 65 点、標準偏差は 10 点——自分は何%の人より上なのか?その答えは正規分布の中にあります。身長・血圧・IQ・測定誤差まで、現実世界の膨大なデータがこの美しい釣鐘形(鐘形曲線)に従います。それを理解することが、データを「記述する」から「推論・予測する」へと踏み出す重要な一歩です。
1. 正規分布とは?
正規分布(ガウス分布)は統計学で最も重要な確率分布です。その特徴的な釣鐘形曲線は、たった2つのパラメータで完全に決まります。
- μ(平均値):鐘形曲線の「中心位置」を決める
- σ(標準偏差):曲線の「幅」を決める——σが大きいほど幅広く低く、小さいほど細く高くなる
正規分布の主な性質:
- 平均値を軸に完全対称
- 平均値・中央値・最頻値がすべて一致
- 曲線は両端に向かって無限に続き、x 軸に近づくが交わらない(漸近線)
- 曲線下の面積は 1(確率の合計 = 100%)
2. 68–95–99.7 ルール
正規分布で最も実用的な経験則です。データがどの範囲に何%収まるかを示します。
| 範囲 | カバー率 | 直感的な意味 |
|---|---|---|
| μ ± 1σ | 約 68.3% | 大多数の典型的な値 |
| μ ± 2σ | 約 95.4% | ほぼすべての通常ケース |
| μ ± 3σ | 約 99.7% | 例外的な極端値以外のほぼすべて |
例:日本人成人男性の平均身長を 171 cm、標準偏差を 6 cm とすると:
- 約 68% は 165〜177 cm
- 約 95% は 159〜183 cm
- 約 99.7% は 153〜189 cm
- 189 cm を超えるか 153 cm に満たない人は、全体の 0.3% 未満
3. Z スコア:すべての値を「標準スケール」に変換する
Z スコアが答える核心的な問い:この値は平均値から何標準偏差離れているのか?
Z = (x − μ) / σ
- Z = 0:平均値とまったく同じ
- Z = 1:平均値より 1σ 高い(約 84 パーセンタイル)
- Z = −1:平均値より 1σ 低い(約 16 パーセンタイル)
- Z = 2:非常に優秀(約 97.7 パーセンタイル)
- Z = −3:極めてまれな低値(約 0.13 パーセンタイル)
Z スコアの実用例
科目をまたいだ成績比較:数学 80 点(平均 70、σ = 10)→ Z = 1.0;英語 85 点(平均 80、σ = 15)→ Z = 0.33。点数は英語の方が高くても、相対的なパフォーマンスは数学の方が優れています。
外れ値の検出:|Z| > 3 のデータポイントは統計的外れ値として扱われ、追加調査の対象となります。
標準化スコア:SAT・GRE・IQ テストはすべて、Z スコアを固定された平均値と標準偏差のスケールに線形変換したものです(例:IQ は平均 100、標準偏差 15)。
4. なぜ正規分布は至るところに現れるのか?中心極限定理
驚くべき事実:母集団の分布が正規分布でなくても、そこから十分大きなサンプルを繰り返し抽出して標本平均を計算すると、その分布は正規分布に収束します。これが統計学で最も重要な定理のひとつ——中心極限定理(Central Limit Theorem, CLT)です。
これが正規分布が普遍的に現れる理由です:
- 身長は遺伝・栄養・環境など多数の独立した要因の合計
- 測定誤差は無数の微小なランダム誤差の累積
- 試験の点数は多くの知識領域の習熟度の総合
CLT は仮説検定や信頼区間の理論的基盤でもあります——標本平均が近似的に正規分布に従うからこそ、サンプルから母集団を推論できるのです。
5. 正規分布が適さない場合
| 状況 | 問題 | 適切な代替分布 |
|---|---|---|
| 給与・資産・株式リターン | 強い右歪み、極端な外れ値 | 対数正規分布 |
| 待ち時間・寿命 | 正の値のみ、右歪み | 指数分布・ワイブル分布 |
| 成功/失敗などの二値結果 | 二値アウトカム | 二項分布 |
| 小標本(n < 30) | CLT がまだ収束していない | t 分布 |
まとめ
- 正規分布は μ と σ によって決まる対称な釣鐘形曲線
- 68–95–99.7 ルール:±1σ が 68%、±2σ が 95%、±3σ が 99.7% のデータをカバー
- Z スコア = (x − μ) / σ——あらゆる値を標準スケールに変換し、異なるデータセット間の比較を可能にする
- 中心極限定理:独立した確率変数の和は正規分布に収束——これが正規分布の普遍性の根本的な理由
- 歪んだデータや二値データには対数正規分布・二項分布などの代替モデルを使う
正規分布は記述統計と統計的推論をつなぐ橋です。鐘形曲線の論理をマスターすれば、「手元のデータを説明する」から「見えていない母集団について推論する」へと進めます——それこそが統計学の真の力です。