python统计分析——多变量描述统计
2023-12-28 18:34:40
资料来源:用Python动手学统计学
多变量的描述统计,通常利用pandas的groupby函数将数据进行分组处理,然后再计算各统计量。
0、导入库和原始数据
import numpy as np
import pandas as pd
import scipy as sp
data_set=pd.DataFrame(
{"type":['A','A','A','B','B','B'],
"data":[2,3,4,6,8,10]}
)
1、利用groupby函数对数据进行分组
group=data_set.groupby('type')
type(group)
现在group变量已经按照type对数据进行分组,后面对group进行统计处理,即可获得不同type的统计量。
2、平均数
group.mean()
3、标准差
group.std(ddof=1),ddof的用法参照:python统计分析——单变量描述统计-CSDN博客
4、最大值和最小值
最大值:group.max()
最小值:group.min()
5、计数
group.count()
6、求和
group.sum()
7、中位数
group.median()
8、四分位数
下四分位数:group.quantile(q=0.25)
上四分位数:group.quantile(q=0.75)
9、一次性获取计数、均值、标准差、极值、四分位数、中位数
group.describe()
文章来源:https://blog.csdn.net/maizeman126/article/details/135274344
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!