平均數、中位數、標準差完整指南:描述統計核心概念與實用場景

「平均薪資 6 萬」——但你身邊大多數人明明只領 3 萬。這不是造假,而是平均數被少數高薪者拉偏的結果。描述統計就是幫你看穿這類數字陷阱的工具:用幾個關鍵指標,快速掌握一組數據的全貌。

一、集中趨勢:資料「中心」在哪裡?

集中趨勢衡量一組數據的代表值,常見有三種:

1. 平均數(Mean)

所有數值加總後除以個數。計算直觀,但容易被極端值(離群值)拉偏

例:10 個員工月薪分別為 3 萬 × 9 人+老闆 60 萬,平均薪資 = (27 + 60) / 10 = 8.7 萬。這個數字讓任何員工看了都覺得「不是在說我」。

2. 中位數(Median)

把資料從小到大排列後,位於正中央的那個值。若個數為偶數,取中間兩個值的平均。對離群值有強大的抵抗力,是薪資、房價、收入分布最常用的代表值。

同樣的例子:排序後中間值為 3 萬——更能代表大多數員工的實際狀況。

3. 眾數(Mode)

出現次數最多的數值,一組資料可能有多個眾數,也可能沒有眾數。常用於類別型資料(例如:哪個口味最受歡迎、哪個城市訂單最多)。

指標最適合的情境離群值影響
平均數對稱分布、無極端值高(容易被拉偏)
中位數偏態分布(薪資、房價)低(穩健)
眾數類別型資料、尋找熱門選項無關

二、分散程度:資料有多「散」?

光知道中心在哪還不夠——「全班平均 75 分」可能是大家都考 75,也可能是一半人 50 分、另一半 100 分。分散程度告訴你資料的離散程度。

全距(Range)

最大值 − 最小值。計算最簡單,但只依賴兩個極端值,容易因單一異常值失真。

變異數(Variance)

每個數值與平均數的差距的平方和平均。平方的目的是讓正負偏差不互相抵消,並放大較大的偏差。

  • 母體變異數:分母用 n,適合已有完整資料時
  • 樣本變異數:分母用 n−1(貝塞爾校正),適合用樣本推估母體時

標準差(Standard Deviation)

變異數的平方根,單位與原始資料相同,因此更易解讀。例:平均身高 170 cm、標準差 8 cm,代表多數人身高落在 162~178 cm 之間(±1 個標準差約涵蓋 68% 的資料)。

變異係數(CV,Coefficient of Variation)

標準差 ÷ 平均數 × 100%,用於比較不同量級資料的分散程度。例:月薪標準差 5,000 元 vs. 房價標準差 500 萬,直接比較沒有意義,但換算成 CV 就可以比較「相對分散程度」。

立即試算:把你的數據貼入統計計算器,一次取得平均數、中位數、標準差、四分位數與直方圖,支援 CSV、XLS、XLSX 匯入,完全在瀏覽器本地運算,資料不上傳。

三、四分位數:更穩健的分散描述

標準差容易受離群值影響。四分位數提供了另一種分散程度的描述方式:

  • Q1(第一四分位數):25% 的資料低於此值
  • Q2(中位數):50% 的資料低於此值
  • Q3(第三四分位數):75% 的資料低於此值
  • IQR(四分位距)= Q3 − Q1:涵蓋中間 50% 資料的範圍

IQR 完全忽略最高和最低的 25% 資料,因此對離群值有強大的抵抗力。箱型圖(Box Plot)就是以 Q1、Q2、Q3、IQR 為基礎繪製的,是呈現資料分布最常用的視覺化方式之一。

四、偏態與峰度:分布的「形狀」

偏態(Skewness)

描述分布是否對稱:

  • 偏態 ≈ 0:接近對稱分布,平均數 ≈ 中位數
  • 偏態 > 0(右偏):長尾在右側,少數極高值拉高平均數(例如薪資、財富分布)
  • 偏態 < 0(左偏):長尾在左側,少數極低值拉低平均數(例如考試成績接近滿分時)

右偏分布中,平均數 > 中位數 > 眾數——這就是為什麼薪資報告常強調「中位數」更能代表一般人的狀況。

峰度(Kurtosis)

描述分布的尖峭程度:

  • 高峰度:資料集中在平均數附近,但尾部較厚(極端值較多)
  • 低峰度:資料較平均分散,沒有明顯的集中點
視覺化你的資料:使用圖表產生器繪製直方圖或折線圖,搭配統計計算器的數值結果,讓數據分析更完整。分析完成後,若需要計算比較不同組別的百分比差異,百分比計算機是最快的方式。

總結

  • 平均數:最常用,但有離群值時容易失真,應搭配中位數判讀
  • 中位數:對偏態分布(薪資、房價)更有代表性
  • 眾數:類別型資料或尋找最熱門選項時使用
  • 標準差:量化資料的離散程度,與平均數搭配使用
  • IQR:比標準差更穩健的分散指標,不受極端值影響
  • 偏態:判斷分布是否對稱,決定應報告平均數還是中位數

描述統計不需要複雜的數學背景——理解每個指標背後的直覺含義,才是真正讀懂數據的關鍵。下次看到「平均薪資」,記得先問:中位數是多少?