SPSS视频教程内容目录和跳转链接

pandas教程:[11]aggregate分组计算

微博@mlln-cn, 并附上文章url链接, 我就能回答你的问题奥!

一旦对数据分组,接下来一定是对各组数据进行计算,这是通过groupby.aggregate()实现的,我们来看一下今天的例子:

  • 先引入必要的模块,然后创建一个DataFrame对象,如果你看了前几篇文章,应该已经知道这个DataFrame了。
    这是内部数据:
  • 根据两个索引color、food进行分组
  • 计算各组总和:
    计算结果为:
  • 计算结果默认使用了两个分组索引color和food作为新的DataFrame的索引(注意计算结果为一个DataFrame对象),可以使用reset_index()来将两个索引转化为列变量
    结果为:
  • 在分组是也可以使用as_index参数达到reset_index()的效果:
    计算结果为:
  • 另外我们经常用到的一个方法为size()返回各组数据量
    结果为:
  • 最后,还有一个经常用到的方法为describe(),对各组数据进行描述性统计:
    计算结果为:

转载请注明来自DataScience.

邮箱: 675495787@qq.com

赞助

持续创造有价值的内容, 我需要你的帮助