Pandas主要处理以下三个数据结构:

序列(Series)

数据帧(DataFrame)

面板(Panel) 

数据结构 维数 描述
序列 1 1维结构,值可变,大小不变
数据帧 2 2维结构,值可变,大小可变,表结构
面板 3维标记,值可变。大小可变

总结了以下几点:

较高的维数据结构是较低维数据结构的容器:例如,DataFrame是Series的容器,Panel 是DataFrame的容器

所有Pandas数据结构值都是不变的

除了序列,其他的Pandas数据结构都是大小可变的,序列是大小不变

最常用的是DataFrame,使用表格数据,在语义上更多考虑行和列,而不是轴0和轴1,比较符合人的思维习惯

这些数据结构构建在Numpy数组基础上

Pandas的核心为两大数据结构:序列、数据帧,数据分析相关的所以事物大多围绕着这两大结构进行的

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐