SPSS视频教程内容目录和跳转链接

pandas教程:[10]groupby选择列和迭代

微博@mlln-cn, 并附上文章url链接, 我就能回答你的问题奥!

groupby对象可以按照列选择数据,这种做法可以减少运算量,提高运算速度。而这里讲的迭代就是对各个组进行迭代以便对各个组进行不同的操作,因为进行相同的操作不必使用迭代。

  • 引入相关模块
  • 创建一个DataFrame对象,有两个index和两个column
  • 打印一下,看看DataFrame到底有哪些内容
  • 以color index进行分类,然后选择a列数据,分组计算a列数据的总数
    计算结果为:
  • 假如我们不选择a列,直接计算总数,可以得到。如果我们不需要b列的数据,那么显然事先选择a列进行计算可以减少无效的运算
  • 迭代输出各个组的数据:
    输出结果:
  • 假如分类索引有两个,分别是color和food
    这时候迭代的结果显示,名称变为一个元组:
  • 致力于数据分析的同行,欢迎与我联系交流

转载请注明来自DataScience.

邮箱: 675495787@qq.com

赞助

持续创造有价值的内容, 我需要你的帮助