统计计量资料描述,为啥一定要先看数据呢?

其实统计计量资料描述,只要一个图就能搞懂核心指标。为啥一定要先看数据呢?计量资料跟计数和等级资料不一样,它自带数值大小来传达信息。统计学描述就像是给数据做个体检,先看清楚它长啥样,再决定用什么方法去处理它。下面这个思维导图把知识分成两块:图表法和指标法,先整体后细节,帮你快速找到你需要的信息。 图表法呢,是把数据用图形表现出来。统计表这个“老古董”已经被软件给边缘化了,以前手工做统计表特别麻烦,现在用SPSS、R、Python这些软件就能一键生成。除非你打算考研,否则别浪费时间背那些公式。统计图方面,直方图是最核心的。直方图用矩形面积代表频数,一眼就能看出来数据集中在哪个区间,还能看出来分布是不是对称的。下一篇我会教大家怎么把直方图画得又好看又有用。 指标法呢,有7个指标加上3个指标(共10个指标)。算术均数、几何均数还有中位数这三位大当家负责统计集中趋势。算术均数是最常用的,但容易受极端值影响;几何均数适合那种平方和类的数据;中位数呢,在数据偏态时比较有用。百分位数呢就是把人群分成几等分,适合做分层研究。 离散趋势的话有7把尺子可以量世界。极差就是最大和最小值的差,算起来最快但容易被异常值干扰。四分位数间距IQR是Q1和Q3之间的差,中间一半数据都被它包进去了。平均偏差MD就是每个值跟平均值的差再求和;离均差平方和SS是MD的升级版;方差S²是标准差S的基础;变异系数CV是标准差除以平均值。 记住这些口诀就行了:对称分布的时候用算术均数加上标准差SD就够了;偏态分布的时候用中位数M加上四分位数间距IQR比较合适;如果要比较不同样本的话用变异系数CV比较靠谱。发文之前先看一眼直方图,如果肉眼可见偏态却只给个算术均数加标准差描述出来审稿老师肯定会皱眉头。 记住啊软件能帮你算出所有数字,但判断什么时候用什么指标才是真正考验统计学素养的地方。