第 4 章 数据的概括性度量

2023-12-29 22:14:58

重点及知识点总结:

众数:可能无众数,一个众数,多个众数。

中位数:排完序,若是偶数个则需要将中间两个数相加除以2,而不是向上取整。

四分位数:排序后出于25%和75%的数,分别叫做下分位数和上分位数。

平均数:也叫做均值。

加权平均数:一般用于分组数据。

几何平均数:主要用于计算平均增长率,是n个变量值乘积的n次方根。

左偏分布:数据小的值多。右偏分布:数据大的值比较多。

异众比率:不是众数的频数占总频数的比例。如总数个数占30%,则异众比率则是1-30% = 70%。

极差:一组数据的最大值和最小值之差。

平均差:各变量值于平均数的差? 的绝对值的平均数。平均差一般不用,性质不好。

方差和标准差:是重点。注意对于样本差和方差,分母对应总体是n,样本是n-1。注意分组数据的公式有点变化。

样本标准差为12.58,样本标准差的含义是:每一天的销售量与平均数相比,平均相差21.58台。

自由度:自由度是指一组数据中可以自由取值的个数。按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。

标准分数:z_{i} =\frac{ x_{i}-\bar{x}}{s}

离散系数:标准差与其相应的均值之比v=s/x拔

经验法则:对称分布,平均数加减标准差分别对应概率。

对称分布的经验法则,123标准差对应68%,95%,99%。

切比雪夫不等式:非对称分布,2,3,4标准差对应75%,89%,94%。

具体内容:

4.1集中趋势的度量

?

?

平均收益率要用几何平均数来算,不能用平均数来算:

?

4.2离散趋势的度量

异众比率:不是众数的频数占总频数的比例。如总数个数占30%,则异众比率则是1-30% = 70%。

极差:一组数据的最大值和最小值之差。

平均差:各变量值于平均数的差? 的绝对值的平均数。平均差一般不用,性质不好。

方差和标准差:是重点。注意对于样本差和方差,分母对应总体是n,样本是n-1。注意分组数据的公式有点变化。

样本标准差为12.58,样本标准差的含义是:每一天的销售量与平均数相比,平均相差21.58台。

自由度:自由度是指一组数据中可以自由取值的个数。按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。

离散系数:标准差与其相应的均值之比v=s/x拔

经验法则:对称分布,平均数加减标准差分别对应概率。

切比雪夫不等式:非对称分布,2,3,4标准差对应75%,89%,94%。

文章来源:https://blog.csdn.net/weixin_44162814/article/details/135291524
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。