Datawhale Pandas 打卡-第四章分组_未分类

Datawhale Pandas 打卡-第四章分组

agg同时使用多个函数

（2）可对特定的列使用特定的聚合函数。

Datawhale Pandas 打卡-第四章分组

agg对特定的列使用特定的聚合函数

(3) 使用自定义函数。

Datawhale Pandas 打卡-第四章分组

agg使用自定义函数

(4) 聚合结果重命名。

Datawhale Pandas 打卡-第四章分组

agg聚合结果重命名

变换和过滤

变换函数的返回值为同长度的序列。当用自定义变换时需要使用 transform 方法，被调用的自定义函数，其传入值为数据源的序列，与 agg 的传入类型是一致的，其最后的返回结果是行列索引与数据源一致的 DataFrame 。

跨列分组

这种应用场景只能使用apply函数了。

练习

Datawhale Pandas 打卡-第四章分组

Ex1题目

1. 先过滤出所属 Country 数超过2个的汽车，即若该汽车的 Country 在总体数据集中出现次数不超过2则剔除，再按 Country 分组计算价格均值、价格变异系数、该 Country 的汽车数量，其中变异系数的计算方法是标准差除以均值，并在结果中把变异系数重命名为 CoV 。

Datawhale Pandas 打卡-第四章分组

Ex1.1

2. 按照表中位置的前三分之一、中间三分之一和后三分之一分组，统计 Price 的均值。
这道题可以仿照‘分组依据的本质’那一段的方法来做。

Datawhale Pandas 打卡-第四章分组

Ex1.2

3. 对类型 Type 分组，对 Price 和 HP 分别计算最大值和最小值，结果会产生多级索引，请用下划线把多级列索引合并为单层索引。
计算最大值和最小值使用agg函数就好了；多级索引合并为单层索引用到了第三章的知识。

Datawhale Pandas 打卡-第四章分组

Ex1.3

4 对类型 Type 分组，对 HP 进行组内的 min-max 归一化。
分组再组内归一化，返回的应该为同长度的序列，此时应该使用transform函数。

Datawhale Pandas 打卡-第四章分组

Ex1.4

5. 对类型 Type 分组，计算 Disp. 与 HP 的相关系数。
跨列计算肯定要考虑使用apply函数了。

Datawhale Pandas 打卡-第四章分组

Ex1.5

文章均来自互联网如有不妥请联系作者删除QQ:314111741 地址：http://www.mqs.net/post/14434.html

Datawhale Pandas 打卡-第四章分组

（2）可对特定的列使用特定的聚合函数。

(3) 使用自定义函数。

(4) 聚合结果重命名。

变换和过滤

跨列分组

练习

添加新评论

最近发表

标签列表

Datawhale Pandas 打卡-第四章 分组

（2）可对特定的列使用特定的聚合函数。

(3) 使用自定义函数。

(4) 聚合结果重命名。

变换和过滤

跨列分组

练习

相关阅读

如何修改第三方jar包里的类的方法，使得jar包里的方法都调用自己重写的方法

李江峰：为东营网友提供及时、准确交通资讯

网站网络推广代运营（网站代运营你需要了解下）

添加新评论

最近发表

标签列表

Datawhale Pandas 打卡-第四章分组