零基础入门数据分析！NumPy+Pandas+Matplotlib 实战全攻略（附代码 + 详解）

码农的神经元

991人浏览 · 2026-03-29 21:01:37

码农的神经元 · 2026-03-29 21:01:37 发布

引言

对于想转行数据分析、零基础学 Python 的朋友来说，NumPy+Pandas+Matplotlib 就是数据分析领域的「三剑客」，也是入行必过的第一关！很多新手踩坑：要么乱学顺序，要么死记硬背函数，要么一上来就啃高阶语法，直接劝退。这篇文章严格按照数值计算→数据处理→可视化→综合实战的科学顺序，4 周搞定三剑客（每天投入 1-2 小时即可），全程无晦涩理论、全是可直接运行的代码 + 逐行详解，学完就能独立完成入门级数据分析项目！

全文框架：前置准备→NumPy（数值基石）→Pandas（核心处理，重点）→Matplotlib（可视化）→综合实战→学习总结，新手跟着走，一步不迷路！

引言

模块 1：前置准备：零基础必看！

1.1 数据分析刚需 Python 基础（只学这些就够）

1.2 三剑客 + Jupyter 一键安装

1.3 Jupyter Notebook 启动与使用（最佳实战工具）

1.4 前置小练习（巩固基础）

模块 2：阶段 1 - NumPy：数值计算底层基石

模块 3：阶段 2 - Pandas：数据分析核心引擎（全文重点！）

3.1 Pandas 核心定位

3.2 核心数据结构（必学）

1. Series（一维数据：带索引的列表）

2. DataFrame（二维数据：Excel 表格，核心中的核心）

3.3 Pandas 必学实战技能（逐行详解）

1. 数据读写（读取 / 导出 Excel/CSV）

3.4 Pandas 专项实战（完整流程）

3.5 Pandas 新手避坑指南

模块 4：阶段 3 - Matplotlib（3-5 天）：数据可视化

4.5 Matplotlib 新手避坑指南

模块 5：阶段 4 - 综合实战项目：电商销售数据分析

模块 1：前置准备：零基础必看！

1.1 数据分析刚需 Python 基础（只学这些就够）

不用啃完整本 Python！仅需掌握 4 个基础知识点，直接开冲三剑客：

变量定义（a=10）
列表 / 字典基础（[1,2,3]/{"name":"小明"}）
条件判断（if/else）
基础循环（for循环）

1.2 三剑客 + Jupyter 一键安装

打开电脑的命令提示符（CMD），直接复制运行这行代码，一键安装所有工具：

# 安装numpy、pandas、matplotlib、jupyter notebook
pip install numpy pandas matplotlib jupyter -i https://pypi.tuna.tsinghua.edu.cn/simple

解释：-i 是清华镜像源，解决安装慢、失败的问题，新手必加！

1.3 Jupyter Notebook 启动与使用（最佳实战工具）

CMD 中输入命令：jupyter notebook
自动弹出浏览器页面，点击New→Python3新建代码文件
代码写在单元格里，按Shift+Enter运行，全程用这个工具跑代码

1.4 前置小练习（巩固基础）

# 基础练习：定义列表+循环+判断
score = [80, 90, 60, 75]
for i in score:
    if i >= 80:
        print(f"分数{i}：优秀")

运行结果：

分数80：优秀
分数90：优秀

模块 2：阶段 1 - NumPy：数值计算底层基石

2.1 NumPy 核心定位

通俗说：Python 自带的列表太慢，NumPy 用「数组」替代列表，专门做数值计算，是 Pandas 的底层基础，处理大数据速度提升 100 倍！

2.2 必学核心知识点 + 实战代码

1. 导入库 + 数组创建（入门第一步）

# 1. 导入numpy库，固定简写为np（行业通用规范）
import numpy as np

# 2. 从列表创建数组
arr1 = np.array([1,2,3,4])
# 3. 生成连续数值数组（左闭右开，1到9）
arr2 = np.arange(1,10)
# 4. 生成全0/全1数组（3行2列）
arr3 = np.zeros((3,2))
arr4 = np.ones((2,3))

print(arr1)
print(arr2)
print(arr3)

逐行解释：

import numpy as np：导入库，np 是固定简写，必须记
np.array()：将 Python 列表转为 NumPy 数组
np.arange()：生成连续数字，和range()用法一致
np.zeros()/ones()：生成指定形状的全 0 / 全 1 数组，括号内是 (行，列)

2. 数组属性查看（快速了解数据）

arr = np.array([[1,2,3],[4,5,6]])
# 查看数组形状（行，列）
print("形状：", arr.shape)
# 查看数组维度
print("维度：", arr.ndim)
# 查看数据类型
print("类型：", arr.dtype)

核心属性：shape（最常用，看数据行列）、ndim（维度）、dtype（数据类型）

3. 索引切片 + 条件筛选

arr = np.arange(1,10)
# 索引：取第2个元素（索引从0开始）
print(arr[1])
# 切片：取第2到第5个元素
print(arr[1:5])
# 条件筛选：取大于5的数字
print(arr[arr>5])

新手易错：索引从 0 开始，切片左闭右开！

4. 向量化运算（NumPy 核心优势）

arr = np.array([1,2,3])
# 数组整体运算，不用写循环！
print(arr + 10)   # 每个元素+10
print(arr * 2)    # 每个元素×2

优势：对比 Python 循环，代码更简洁、计算更快！

5. 常用统计函数

arr = np.array([1,2,3,4,5])
print("求和：", np.sum(arr))
print("均值：", np.mean(arr))
print("最大值：", np.max(arr))
print("标准差：", np.std(arr))

高频函数：sum(求和)、mean(均值)、max(最值)、std(标准差)