Assign group averages to each row in python/pandas(将组平均值分配给Python/PANAS中的每一行)
本文介绍了将组平均值分配给Python/PANAS中的每一行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个数据帧,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。
DF
Cashier# Store# Sales Refunds
001 001 100 1
002 001 150 2
003 001 200 2
004 002 400 1
005 002 600 4
DF-所需
Cashier# Store# Sales Refunds Sales_StoreAvg Sales_All_Stores_Avg
001 001 100 1 150 290
002 001 150 2 150 290
003 001 200 2 150 290
004 002 400 1 500 290
005 002 600 4 500 290
我的尝试 我创建了另外两个数据帧,然后执行左连接
df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean()
推荐答案
我认为新列需要GroupBy.transform
由mean
的聚合值填充:
df['Sales_StoreAvg'] = df.groupby('Store#')['Sales'].transform('mean')
df['Sales_All_Stores_Avg'] = df['Sales'].mean()
print (df)
Cashier# Store# Sales Refunds Sales_StoreAvg Sales_All_Stores_Avg
0 1 1 100 1 150 290.0
1 2 1 150 2 150 290.0
2 3 1 200 2 150 290.0
3 4 2 400 1 500 290.0
4 5 2 600 4 500 290.0
这篇关于将组平均值分配给Python/PANAS中的每一行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:将组平均值分配给Python/PANAS中的每一行


基础教程推荐
猜你喜欢
- 无法导入 Pytorch [WinError 126] 找不到指定的模块 2022-01-01
- 在Python中从Azure BLOB存储中读取文件 2022-01-01
- 修改列表中的数据帧不起作用 2022-01-01
- 使用大型矩阵时禁止 Pycharm 输出中的自动换行符 2022-01-01
- 在同一图形上绘制Bokeh的烛台和音量条 2022-01-01
- 包装空间模型 2022-01-01
- PANDA VALUE_COUNTS包含GROUP BY之前的所有值 2022-01-01
- PermissionError: pip 从 8.1.1 升级到 8.1.2 2022-01-01
- 求两个直方图的卷积 2022-01-01
- Plotly:如何设置绘图图形的样式,使其不显示缺失日期的间隙? 2022-01-01