「平均薪資 5 萬!」「我們的用戶滿意度高達 92%!」「喝咖啡的人比不喝的人長壽 20%!」——這些句子讀起來很有說服力,但它們可能都在誤導你。數據本身不會說謊,但呈現方式、取樣方法、分析角度卻充滿陷阱。學會辨識這些統計誤區,是現代人必備的數據素養。
一、平均數陷阱:「平均」不代表「典型」
「平均」是最常被誤用的統計概念。問題在於:平均數對極端值極度敏感,幾個異常高值就能把整體平均拉高,讓你以為「大家都差不多」。
實例:薪資的平均數 vs. 中位數
假設一個 10 人小公司的薪資如下(單位:萬元):
| 員工 | 月薪(萬) |
|---|---|
| 員工 1–8 | 3、3、3.5、3.5、4、4、4.5、4.5 |
| 主管 | 15 |
| 老闆 | 50 |
平均薪資 = (3×2 + 3.5×2 + 4×2 + 4.5×2 + 15 + 50) ÷ 10 = 9.5 萬
中位數(排序後第 5、6 名的平均)= 4 萬
「平均薪資 9.5 萬」是真實數字,但 80% 的員工月薪在 4.5 萬以下。中位數才是更能代表「典型員工」薪資的指標。
什麼時候用平均數,什麼時候用中位數?
- 平均數適合:數據分布較對稱、沒有明顯極端值時(如身高、考試成績)
- 中位數適合:數據有極端值或嚴重偏斜時(如薪資、房價、財富分布)
- 眾數適合:類別型數據,或想知道「最常見」的值時
二、倖存者偏差:你看到的只是「活下來的」
倖存者偏差(Survivorship Bias)是最隱蔽、危害最大的統計謬誤之一。它的核心問題是:我們的數據只包含「成功存活」的案例,忽略了沉默的失敗者。
二戰轟炸機的故事
二戰期間,軍方研究返航轟炸機的彈孔分布,發現機翼和機身彈孔最多,引擎區域最少。直覺結論:「加強機翼的裝甲。」
數學家亞伯拉罕·瓦爾德指出問題所在:這些是「返航成功」的飛機。引擎被擊中的飛機根本沒有回來,所以樣本中引擎彈孔反而少——但那恰恰是最致命的位置。正確決策:加強引擎防護。
日常生活中的倖存者偏差
- 「創業成功的人都說堅持最重要」——你聽不到那些同樣堅持卻失敗的人的故事
- 「這個老房子住了 80 年都沒問題」——品質差的房子早就拆了,你看不到它們
- 「古人活到 80 歲,說明古代養生很好」——能活到 80 的是極少數倖存者,平均壽命遠低於現代
- 「這支基金 10 年都是正報酬」——那些中途關閉的虧損基金已從資料庫中消失
如何避免倖存者偏差?
問自己:「還有哪些案例因為某種原因沒被納入我的樣本?」 主動尋找「失敗案例」、「停業的公司」、「未發表的研究」,補全你的數據視野。
三、相關不等於因果:巧合陷阱
兩件事同時發生,不代表一件事「造成」另一件事。相關性(Correlation)≠ 因果性(Causation)是統計學最重要的原則之一。
荒謬但真實的相關案例
- 美國溺水人數 vs. 尼可拉斯·凱吉主演的電影部數:每年高度相關(r ≈ 0.67)
- 冰淇淋銷量 vs. 溺水死亡率:正相關——原因是第三變數「天氣熱」同時驅動兩者
- 腳的大小 vs. 閱讀能力(兒童):正相關——因為年齡越大,腳越大,閱讀能力也越強
三種解釋相關性的可能
- A 導致 B(真正的因果)
- B 導致 A(因果方向相反)——如「快樂的人更健康」,可能是「健康的人更快樂」
- C 同時導致 A 和 B(混淆變數)——如天氣熱同時導致冰淇淋銷量上升和溺水率上升
要確立因果關係,最嚴格的方法是隨機對照實驗(RCT)——隨機分組、控制其他變數,才能排除混淆因素。這就是為什麼新藥審批需要臨床試驗,而不是只看「服藥者比不服藥者更健康」。
四、圖表誤導:視覺化的黑暗藝術
數字沒有說謊,但圖表的設計方式可以讓同一組數字看起來天差地別。
截斷 Y 軸
柱狀圖或折線圖的 Y 軸不從 0 開始,能讓微小的差距看起來非常巨大。例如:某產品滿意度從 87% 到 89%,如果 Y 軸從 85% 開始,看起來像增長了一倍。
選擇性時間範圍(Cherry-picking)
股票圖表從低谷開始,看起來漲幅驚人;從高峰開始,看起來跌跌不休。選擇對自己有利的起點和終點,是操弄數據最常見的手法。
雙 Y 軸誤導
將兩條無關的趨勢線放在同一張圖上,用不同的 Y 軸刻度,讓它們看起來完美重疊——人腦會自動認為兩者有關聯。
樣本大小被省略
「滿意度 92%」聽起來很好,但如果只調查了 13 個人,這個數字毫無統計意義。媒體報導中,調查樣本數和誤差範圍往往被省略。
五、小樣本謬誤:用「少數」推論「全體」
樣本量太小時,結果會受隨機波動主導,根本無法代表全體。
小縣市的癌症率問題
研究發現,「癌症發生率最高」和「癌症發生率最低」的縣市,往往都是人口最少的地方。這不是因為小地方特別健康或特別不健康,而是因為樣本數小,隨機波動就大——10 個人裡有 1 個癌症患者,發生率就是 10%;100,000 人裡有 500 個,發生率只有 0.5%。
A/B 測試中的常見錯誤
很多行銷人員在 A/B 測試開始後幾天,看到 A 組轉換率比 B 組高 30% 就立即停止測試宣布結論。然而,這個差異可能只是隨機波動——需要足夠的樣本數(通常幾千到幾萬次觸及)才能達到統計顯著性(p < 0.05)。
六、確認偏誤:只看想看的數據
我們天生傾向於尋找支持自己既有信念的證據,忽略反面證據。這叫做確認偏誤(Confirmation Bias),是所有統計謬誤中最難克服的一種,因為它發生在你決定「收集哪些數據」之前。
如何對抗確認偏誤?
- 預先登記假設:在收集數據前,明確寫下你預測的結果和分析方法,防止事後「調整」分析方向
- 主動尋找反例:問自己「什麼樣的數據會讓我改變看法?」然後去找這樣的數據
- 尋求反對意見:讓持不同觀點的人審查你的分析,而不只是找支持者
- 區分探索性和驗證性分析:先探索數據找假設,再用新數據驗證——不要用同一份數據既「發現」又「驗證」同一個結論
七、統計顯著 ≠ 實際重要
「p < 0.05」代表結果在統計上顯著,但不代表這個效果在現實中有意義。
例:一項有 100 萬人參與的研究發現,每天多走 100 步的人,10 年後心臟病發作率下降了 0.003%。統計上高度顯著(p < 0.001),但實際效果幾乎可以忽略不計。
反之,樣本量小的研究可能發現真實且重要的效果,但未達統計顯著——這叫做第二型錯誤(假陰性)。
正確做法:除了 p 值,還要看效果量(Effect Size)和信賴區間(Confidence Interval),它們告訴你效果有多大、估計有多精確。
總結:培養批判性數據思維的檢查清單
下次看到令人驚訝的數據或研究結論時,問自己:
- 使用的是平均數還是中位數?分布是否偏斜?
- 樣本是否存在倖存者偏差?有哪些案例沒被納入?
- 兩件事相關,是否有合理的因果機制?還是有第三個混淆變數?
- 圖表的 Y 軸是否從 0 開始?時間範圍是否被刻意選擇?
- 樣本數是多少?是否足夠?調查方法是否可靠?
- 這個結論是否只符合研究者預期?有沒有反例?
- 統計顯著性之外,實際效果量有多大?
數據識讀不是要你對所有數字都抱持懷疑,而是學會問對問題。理解數據背後的假設和限制,才能從龐大的資訊洪流中找到真正有價值的訊號。