分组聚合操作

1.单层分组聚合
 df=df.groupby(‘列索引’)[‘列名’].mean():聚合求平均值
2.多层分组聚合
 df=df.groupby([‘列1’,‘列2’],……,as_index=False包含自带行索引)[‘列名’].mean()
 s.unstack()可以将多层聚合后的Series对象转变成DataFrame对象,将索引的最后一行转变成DataFrame对象的列索引,剩下的索引为DataFrame对象的行索引

数据可视化

1.可视化的三个功能:信息记录;支持对信息的推理和分析;信息传播与协同。
2.数据的五种相关关系:构成(占总体百分比),比较(项目排名),趋势(随时间变化),分布(项目频率),联系(变量之间关系)
3.让matplotlib库能够支持中文字体
 导入matplotlib库的pyplot模块:
  from matplotlib importt pyplot as plt
 设置中文字体
  plt.rcParms[‘font.family’]=[‘source Han Sans CN’]
4.图形简单绘制
 df.plot(kind=’ ‘,figsize=(7,7),title=’ '):
  kind:图表类型 line-折线 pie:饼图 bar:条形图
  figsize:画布大小
  title:标题
pandas库直接绘图,与matplotlib库没有直接关系

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐