數據說謊的方式:平均數陷阱、倖存者偏差與統計誤區完整解析

「平均薪資 5 萬!」「我們的用戶滿意度高達 92%!」「喝咖啡的人比不喝的人長壽 20%!」——這些句子讀起來很有說服力,但它們可能都在誤導你。數據本身不會說謊,但呈現方式、取樣方法、分析角度卻充滿陷阱。學會辨識這些統計誤區,是現代人必備的數據素養。

一、平均數陷阱:「平均」不代表「典型」

「平均」是最常被誤用的統計概念。問題在於:平均數對極端值極度敏感,幾個異常高值就能把整體平均拉高,讓你以為「大家都差不多」。

實例:薪資的平均數 vs. 中位數

假設一個 10 人小公司的薪資如下(單位:萬元):

員工月薪(萬)
員工 1–83、3、3.5、3.5、4、4、4.5、4.5
主管15
老闆50

平均薪資 = (3×2 + 3.5×2 + 4×2 + 4.5×2 + 15 + 50) ÷ 10 = 9.5 萬

中位數(排序後第 5、6 名的平均)= 4 萬

「平均薪資 9.5 萬」是真實數字,但 80% 的員工月薪在 4.5 萬以下。中位數才是更能代表「典型員工」薪資的指標。

自己算看看:把你的一組數字輸入統計計算器,同時查看平均數、中位數與標準差。當平均數與中位數差距很大時,代表數據存在嚴重偏斜,要格外小心「平均值」的代表性。

什麼時候用平均數,什麼時候用中位數?

  • 平均數適合:數據分布較對稱、沒有明顯極端值時(如身高、考試成績)
  • 中位數適合:數據有極端值或嚴重偏斜時(如薪資、房價、財富分布)
  • 眾數適合:類別型數據,或想知道「最常見」的值時

二、倖存者偏差:你看到的只是「活下來的」

倖存者偏差(Survivorship Bias)是最隱蔽、危害最大的統計謬誤之一。它的核心問題是:我們的數據只包含「成功存活」的案例,忽略了沉默的失敗者。

二戰轟炸機的故事

二戰期間,軍方研究返航轟炸機的彈孔分布,發現機翼和機身彈孔最多,引擎區域最少。直覺結論:「加強機翼的裝甲。」

數學家亞伯拉罕·瓦爾德指出問題所在:這些是「返航成功」的飛機。引擎被擊中的飛機根本沒有回來,所以樣本中引擎彈孔反而少——但那恰恰是最致命的位置。正確決策:加強引擎防護

日常生活中的倖存者偏差

  • 「創業成功的人都說堅持最重要」——你聽不到那些同樣堅持卻失敗的人的故事
  • 「這個老房子住了 80 年都沒問題」——品質差的房子早就拆了,你看不到它們
  • 「古人活到 80 歲,說明古代養生很好」——能活到 80 的是極少數倖存者,平均壽命遠低於現代
  • 「這支基金 10 年都是正報酬」——那些中途關閉的虧損基金已從資料庫中消失

如何避免倖存者偏差?

問自己:「還有哪些案例因為某種原因沒被納入我的樣本?」 主動尋找「失敗案例」、「停業的公司」、「未發表的研究」,補全你的數據視野。

三、相關不等於因果:巧合陷阱

兩件事同時發生,不代表一件事「造成」另一件事。相關性(Correlation)≠ 因果性(Causation)是統計學最重要的原則之一。

荒謬但真實的相關案例

  • 美國溺水人數 vs. 尼可拉斯·凱吉主演的電影部數:每年高度相關(r ≈ 0.67)
  • 冰淇淋銷量 vs. 溺水死亡率:正相關——原因是第三變數「天氣熱」同時驅動兩者
  • 腳的大小 vs. 閱讀能力(兒童):正相關——因為年齡越大,腳越大,閱讀能力也越強

三種解釋相關性的可能

  1. A 導致 B(真正的因果)
  2. B 導致 A(因果方向相反)——如「快樂的人更健康」,可能是「健康的人更快樂」
  3. C 同時導致 A 和 B(混淆變數)——如天氣熱同時導致冰淇淋銷量上升和溺水率上升

要確立因果關係,最嚴格的方法是隨機對照實驗(RCT)——隨機分組、控制其他變數,才能排除混淆因素。這就是為什麼新藥審批需要臨床試驗,而不是只看「服藥者比不服藥者更健康」。

視覺化相關性:把兩組數據輸入圖表產生器,畫成散點圖,觀察數據點的分布趨勢。即使相關係數高,也要進一步思考背後是否有合理的因果機制,還是只是巧合。

四、圖表誤導:視覺化的黑暗藝術

數字沒有說謊,但圖表的設計方式可以讓同一組數字看起來天差地別。

截斷 Y 軸

柱狀圖或折線圖的 Y 軸不從 0 開始,能讓微小的差距看起來非常巨大。例如:某產品滿意度從 87% 到 89%,如果 Y 軸從 85% 開始,看起來像增長了一倍。

選擇性時間範圍(Cherry-picking)

股票圖表從低谷開始,看起來漲幅驚人;從高峰開始,看起來跌跌不休。選擇對自己有利的起點和終點,是操弄數據最常見的手法。

雙 Y 軸誤導

將兩條無關的趨勢線放在同一張圖上,用不同的 Y 軸刻度,讓它們看起來完美重疊——人腦會自動認為兩者有關聯。

樣本大小被省略

「滿意度 92%」聽起來很好,但如果只調查了 13 個人,這個數字毫無統計意義。媒體報導中,調查樣本數和誤差範圍往往被省略。

驗證百分比的意義:看到百分比數字時,用百分比計算機換算成絕對人數。「成長了 200%」聽起來驚人,但如果基數是 3 人,那也只是從 3 人增加到 9 人,效果有限。

五、小樣本謬誤:用「少數」推論「全體」

樣本量太小時,結果會受隨機波動主導,根本無法代表全體。

小縣市的癌症率問題

研究發現,「癌症發生率最高」和「癌症發生率最低」的縣市,往往都是人口最少的地方。這不是因為小地方特別健康或特別不健康,而是因為樣本數小,隨機波動就大——10 個人裡有 1 個癌症患者,發生率就是 10%;100,000 人裡有 500 個,發生率只有 0.5%。

A/B 測試中的常見錯誤

很多行銷人員在 A/B 測試開始後幾天,看到 A 組轉換率比 B 組高 30% 就立即停止測試宣布結論。然而,這個差異可能只是隨機波動——需要足夠的樣本數(通常幾千到幾萬次觸及)才能達到統計顯著性(p < 0.05)。

六、確認偏誤:只看想看的數據

我們天生傾向於尋找支持自己既有信念的證據,忽略反面證據。這叫做確認偏誤(Confirmation Bias),是所有統計謬誤中最難克服的一種,因為它發生在你決定「收集哪些數據」之前。

如何對抗確認偏誤?

  • 預先登記假設:在收集數據前,明確寫下你預測的結果和分析方法,防止事後「調整」分析方向
  • 主動尋找反例:問自己「什麼樣的數據會讓我改變看法?」然後去找這樣的數據
  • 尋求反對意見:讓持不同觀點的人審查你的分析,而不只是找支持者
  • 區分探索性和驗證性分析:先探索數據找假設,再用新數據驗證——不要用同一份數據既「發現」又「驗證」同一個結論

七、統計顯著 ≠ 實際重要

「p < 0.05」代表結果在統計上顯著,但不代表這個效果在現實中有意義。

例:一項有 100 萬人參與的研究發現,每天多走 100 步的人,10 年後心臟病發作率下降了 0.003%。統計上高度顯著(p < 0.001),但實際效果幾乎可以忽略不計。

反之,樣本量小的研究可能發現真實且重要的效果,但未達統計顯著——這叫做第二型錯誤(假陰性)。

正確做法:除了 p 值,還要看效果量(Effect Size)信賴區間(Confidence Interval),它們告訴你效果有多大、估計有多精確。

總結:培養批判性數據思維的檢查清單

下次看到令人驚訝的數據或研究結論時,問自己:

  • 使用的是平均數還是中位數?分布是否偏斜?
  • 樣本是否存在倖存者偏差?有哪些案例沒被納入?
  • 兩件事相關,是否有合理的因果機制?還是有第三個混淆變數?
  • 圖表的 Y 軸是否從 0 開始?時間範圍是否被刻意選擇?
  • 樣本數是多少?是否足夠?調查方法是否可靠?
  • 這個結論是否只符合研究者預期?有沒有反例?
  • 統計顯著性之外,實際效果量有多大?

數據識讀不是要你對所有數字都抱持懷疑,而是學會問對問題。理解數據背後的假設和限制,才能從龐大的資訊洪流中找到真正有價值的訊號。