抽样调查完整指南：样本数怎么决定？民调、A/B 测试与置信区间入门

「民调显示候选人支持率 48%，误差范围 ±3%」——你知道这个「误差范围」是怎么算出来的吗？为什么只问 1000 人，就能代表数以亿计的人的意见？抽样统计解答了一个核心问题：我们不需要调查每个人，也能对全体做出可靠的推断——只要方法正确。

一、为什么需要抽样？

理想上，若能调查「所有人」（全普查），结果最准确。但实际上全普查往往不可行：

抽样统计的核心洞见：只要样本是随机且有代表性的，即使只取母体的一小部分，也能以量化的精确度推断母体特性。

统计推断的任务，就是从「样本统计量」推估「母体参数」，并量化这个估计的不确定性。

「48% ±3%」的完整说法是：95% 置信区间为 45%～51%。它的意思是：

若用相同方法重复抽样 100 次，约有 95 次所得的置信区间会包含母体真实值。

置信区间 = p̂ ± Z × √(p̂(1−p̂)/n)

计算看看：将你的数据输入统计计算器，可以快速计算样本的均值、标准差，再配合上方公式计算置信区间，验证你对数据的直觉判断。

样本数公式：n = Z² × p(1−p) / E²

重要发现：误差缩小一半，样本数要增加 4 倍。另一个反直觉的结论：母体大小几乎不影响所需样本数——1,000 人的样本既能代表中国大陆人口，也能代表台湾人口，所需样本数相差无几。

p 值是最常被误解的统计概念：p 值是「假设 H₀ 正确时，观察到现有数据的概率」——不是「H₀ 为真的概率」。

统计显著 ≠ 实际重要：样本数够大时，即使微小差异也会达到统计显著性。除了 p 值，还要评估效应大小（Effect Size）。

视觉化比较：将 A/B 两组的数据分布输入图表生成器，用柱状图或折线图呈现两组数据的差异，帮助直观判断效应大小。

计算成长率与占比：阅读报告时需要计算百分比变化时，百分比计算器能帮你快速验算数字。

统计推断的终极目标，不是计算一个精确的数字，而是在不确定性中做出有依据的判断。