数据分析——分组聚合
分组聚合操作1.单层分组聚合 df=df.groupby(‘列索引’)[‘列名’].mean():聚合求平均值2.多层分组聚合 df=df.groupby([‘列1’,‘列2’],……,as_index=False包含自带行索引)[‘列名’].mean() s.unstack()可以将多层聚合后的Series对象转变成DataFrame对象,将索引的最后一行转变成DataFrame对象的列索引,剩
分组聚合操作
1.单层分组聚合
df=df.groupby(‘列索引’)[‘列名’].mean():聚合求平均值
2.多层分组聚合
df=df.groupby([‘列1’,‘列2’],……,as_index=False包含自带行索引)[‘列名’].mean()
s.unstack()可以将多层聚合后的Series对象转变成DataFrame对象,将索引的最后一行转变成DataFrame对象的列索引,剩下的索引为DataFrame对象的行索引
数据可视化
1.可视化的三个功能:信息记录;支持对信息的推理和分析;信息传播与协同。
2.数据的五种相关关系:构成(占总体百分比),比较(项目排名),趋势(随时间变化),分布(项目频率),联系(变量之间关系)
3.让matplotlib库能够支持中文字体
导入matplotlib库的pyplot模块:
from matplotlib importt pyplot as plt
设置中文字体
plt.rcParms[‘font.family’]=[‘source Han Sans CN’]
4.图形简单绘制
df.plot(kind=’ ‘,figsize=(7,7),title=’ '):
kind:图表类型 line-折线 pie:饼图 bar:条形图
figsize:画布大小
title:标题
pandas库直接绘图,与matplotlib库没有直接关系

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)