1. 是啥玩意
描述统计:你就理解为“整理工”。把一堆乱七八糟的数据,用图表、平均数这些工具整理得人能看懂。核心就一句:只描述你手里现有的这堆数据,不往外瞎猜。
推断统计:你就理解为“算卦的”(科学的那种)。通过抽样的少量数据,去推测、估计总体是个啥情况,还要算算这个推测靠不靠谱。核心是:用样本猜总体,并且说明猜得有多准。
2. 干嘛用的
描述统计:
算平均数、中位数、标准差。
画个柱状图、饼图、折线图。
告诉你这次考试全班最高分多少、最低分多少、平均分多少。
到此为止,不说别的。
推断统计:
搞假设检验(比如,猜新教学方法到底有没有用)。
搞参数估计(比如,通过1000个用户的调查,估计全国用户满意度在85%-90%之间)。
做回归分析、方差分析。
总在回答“有多大把握?”“是不是真的?”这种问题。
3. 核心差别一句话戳破
描述统计:有啥说啥,就事论事。你手里有一筐苹果,你就说这筐苹果平均多大、最重的多少、大小分布如何。不说别的筐。
推断统计:窥一斑而猜全豹,还得说明猜错的风险。你从一大片果园里随机摘一筐苹果,通过研究这筐苹果,去推测整片果园苹果的平均重量,并且承认“我这个推测可能有5%的犯错可能”。
4. 最容易搞混的坑点
坑点1:觉得算个“样本平均分”就是推断统计。错! 如果你只算了这个样本的平均分,没拿去推测总体,那它依然是描述统计。
坑点2:觉得描述统计低级。错! 数据描述是基础,描述不清,推断全歪。它是推断统计的必备前戏。
坑点3:推断统计的结论永远带个“尾巴”。比如“在95%置信水平下显著”,意思就是“我有95%把握,但还有5%的可能是在胡说”。描述统计的结论是确定的(对当前数据而言)。