數據說謊的方式：平均數陷阱、倖存者偏差與統計誤區完整解析

「平均薪資 5 萬！」「我們的用戶滿意度高達 92%！」「喝咖啡的人比不喝的人長壽 20%！」——這些句子讀起來很有說服力，但它們可能都在誤導你。數據本身不會說謊，但呈現方式、取樣方法、分析角度卻充滿陷阱。學會辨識這些統計誤區，是現代人必備的數據素養。

一、平均數陷阱：「平均」不代表「典型」

「平均」是最常被誤用的統計概念。問題在於：平均數對極端值極度敏感，幾個異常高值就能把整體平均拉高，讓你以為「大家都差不多」。

實例：薪資的平均數 vs. 中位數

假設一個 10 人小公司的薪資如下（單位：萬元）：

員工	月薪（萬）
員工 1–8	3、3、3.5、3.5、4、4、4.5、4.5
主管	15
老闆	50

平均薪資 = (3×2 + 3.5×2 + 4×2 + 4.5×2 + 15 + 50) ÷ 10 = 9.5 萬

中位數（排序後第 5、6 名的平均）= 4 萬

「平均薪資 9.5 萬」是真實數字，但 80% 的員工月薪在 4.5 萬以下。中位數才是更能代表「典型員工」薪資的指標。

自己算看看：把你的一組數字輸入統計計算器，同時查看平均數、中位數與標準差。當平均數與中位數差距很大時，代表數據存在嚴重偏斜，要格外小心「平均值」的代表性。

什麼時候用平均數，什麼時候用中位數？

平均數適合：數據分布較對稱、沒有明顯極端值時（如身高、考試成績）
中位數適合：數據有極端值或嚴重偏斜時（如薪資、房價、財富分布）
眾數適合：類別型數據，或想知道「最常見」的值時

二、倖存者偏差：你看到的只是「活下來的」

倖存者偏差（Survivorship Bias）是最隱蔽、危害最大的統計謬誤之一。它的核心問題是：我們的數據只包含「成功存活」的案例，忽略了沉默的失敗者。

二戰轟炸機的故事

二戰期間，軍方研究返航轟炸機的彈孔分布，發現機翼和機身彈孔最多，引擎區域最少。直覺結論：「加強機翼的裝甲。」

數學家亞伯拉罕·瓦爾德指出問題所在：這些是「返航成功」的飛機。引擎被擊中的飛機根本沒有回來，所以樣本中引擎彈孔反而少——但那恰恰是最致命的位置。正確決策：加強引擎防護。

日常生活中的倖存者偏差

「創業成功的人都說堅持最重要」——你聽不到那些同樣堅持卻失敗的人的故事
「這個老房子住了 80 年都沒問題」——品質差的房子早就拆了，你看不到它們
「古人活到 80 歲，說明古代養生很好」——能活到 80 的是極少數倖存者，平均壽命遠低於現代
「這支基金 10 年都是正報酬」——那些中途關閉的虧損基金已從資料庫中消失

如何避免倖存者偏差？

問自己：「還有哪些案例因為某種原因沒被納入我的樣本？」 主動尋找「失敗案例」、「停業的公司」、「未發表的研究」，補全你的數據視野。

三、相關不等於因果：巧合陷阱

兩件事同時發生，不代表一件事「造成」另一件事。相關性（Correlation）≠ 因果性（Causation）是統計學最重要的原則之一。

荒謬但真實的相關案例

美國溺水人數 vs. 尼可拉斯·凱吉主演的電影部數：每年高度相關（r ≈ 0.67）
冰淇淋銷量 vs. 溺水死亡率：正相關——原因是第三變數「天氣熱」同時驅動兩者
腳的大小 vs. 閱讀能力（兒童）：正相關——因為年齡越大，腳越大，閱讀能力也越強

三種解釋相關性的可能

A 導致 B（真正的因果）
B 導致 A（因果方向相反）——如「快樂的人更健康」，可能是「健康的人更快樂」
C 同時導致 A 和 B（混淆變數）——如天氣熱同時導致冰淇淋銷量上升和溺水率上升

要確立因果關係，最嚴格的方法是隨機對照實驗（RCT）——隨機分組、控制其他變數，才能排除混淆因素。這就是為什麼新藥審批需要臨床試驗，而不是只看「服藥者比不服藥者更健康」。

視覺化相關性：把兩組數據輸入圖表產生器，畫成散點圖，觀察數據點的分布趨勢。即使相關係數高，也要進一步思考背後是否有合理的因果機制，還是只是巧合。

四、圖表誤導：視覺化的黑暗藝術

數字沒有說謊，但圖表的設計方式可以讓同一組數字看起來天差地別。

截斷 Y 軸

柱狀圖或折線圖的 Y 軸不從 0 開始，能讓微小的差距看起來非常巨大。例如：某產品滿意度從 87% 到 89%，如果 Y 軸從 85% 開始，看起來像增長了一倍。

選擇性時間範圍（Cherry-picking）

股票圖表從低谷開始，看起來漲幅驚人；從高峰開始，看起來跌跌不休。選擇對自己有利的起點和終點，是操弄數據最常見的手法。

雙 Y 軸誤導

將兩條無關的趨勢線放在同一張圖上，用不同的 Y 軸刻度，讓它們看起來完美重疊——人腦會自動認為兩者有關聯。

樣本大小被省略

「滿意度 92%」聽起來很好，但如果只調查了 13 個人，這個數字毫無統計意義。媒體報導中，調查樣本數和誤差範圍往往被省略。

驗證百分比的意義：看到百分比數字時，用百分比計算機換算成絕對人數。「成長了 200%」聽起來驚人，但如果基數是 3 人，那也只是從 3 人增加到 9 人，效果有限。

五、小樣本謬誤：用「少數」推論「全體」

樣本量太小時，結果會受隨機波動主導，根本無法代表全體。

小縣市的癌症率問題

研究發現，「癌症發生率最高」和「癌症發生率最低」的縣市，往往都是人口最少的地方。這不是因為小地方特別健康或特別不健康，而是因為樣本數小，隨機波動就大——10 個人裡有 1 個癌症患者，發生率就是 10%；100,000 人裡有 500 個，發生率只有 0.5%。

A/B 測試中的常見錯誤

很多行銷人員在 A/B 測試開始後幾天，看到 A 組轉換率比 B 組高 30% 就立即停止測試宣布結論。然而，這個差異可能只是隨機波動——需要足夠的樣本數（通常幾千到幾萬次觸及）才能達到統計顯著性（p < 0.05）。

六、確認偏誤：只看想看的數據

我們天生傾向於尋找支持自己既有信念的證據，忽略反面證據。這叫做確認偏誤（Confirmation Bias），是所有統計謬誤中最難克服的一種，因為它發生在你決定「收集哪些數據」之前。

如何對抗確認偏誤？

預先登記假設：在收集數據前，明確寫下你預測的結果和分析方法，防止事後「調整」分析方向
主動尋找反例：問自己「什麼樣的數據會讓我改變看法？」然後去找這樣的數據
尋求反對意見：讓持不同觀點的人審查你的分析，而不只是找支持者
區分探索性和驗證性分析：先探索數據找假設，再用新數據驗證——不要用同一份數據既「發現」又「驗證」同一個結論

七、統計顯著 ≠ 實際重要

「p < 0.05」代表結果在統計上顯著，但不代表這個效果在現實中有意義。

例：一項有 100 萬人參與的研究發現，每天多走 100 步的人，10 年後心臟病發作率下降了 0.003%。統計上高度顯著（p < 0.001），但實際效果幾乎可以忽略不計。

反之，樣本量小的研究可能發現真實且重要的效果，但未達統計顯著——這叫做第二型錯誤（假陰性）。

正確做法：除了 p 值，還要看效果量（Effect Size）和信賴區間（Confidence Interval），它們告訴你效果有多大、估計有多精確。

總結：培養批判性數據思維的檢查清單

下次看到令人驚訝的數據或研究結論時，問自己：

使用的是平均數還是中位數？分布是否偏斜？
樣本是否存在倖存者偏差？有哪些案例沒被納入？
兩件事相關，是否有合理的因果機制？還是有第三個混淆變數？
圖表的 Y 軸是否從 0 開始？時間範圍是否被刻意選擇？
樣本數是多少？是否足夠？調查方法是否可靠？
這個結論是否只符合研究者預期？有沒有反例？
統計顯著性之外，實際效果量有多大？

數據識讀不是要你對所有數字都抱持懷疑，而是學會問對問題。理解數據背後的假設和限制，才能從龐大的資訊洪流中找到真正有價值的訊號。