四种均值计算方法：算术平均、几何平均、调和平均、平方平均

本文介绍了四种常用的均值计算方法：算术平均、几何平均、调和平均和平方平均。算术平均是最基础的计算方式，适用于描述数据集中趋势；几何平均适合处理增长率、比率等乘积关系数据；调和平均则适用于速率、比率等反比关系数据；平方平均（均方根）常用于处理波动较大的数据。每种方法各有特点和应用场景，选择合适的方法取决于数据类型和分析目的。文章详细阐述了各种均值的数学原理、计算方法和典型应用，并提供了Python实

qq_42758052

9302人浏览 · 2025-07-29 12:30:17

qq_42758052 · 2025-07-29 12:30:17 发布

四种均值计算方法：算术平均、几何平均、调和平均、平方平均

一、引言

在数据分析和数学计算中，均值（Mean）是描述数据集中趋势的最基本统计量之一。然而，“均值” 一词并非指代单一的计算方法，而是包含多种不同类型的平均计算方式。最常用的四种均值计算方法分别是：算术平均（Arithmetic Mean）、几何平均（Geometric Mean）、调和平均（Harmonic Mean）和平方平均（Quadratic Mean，也称均方根 Root Mean Square, RMS）。

二、四种均值的详细介绍

2.1 算术平均（Arithmetic Mean）

2.1.1 定义与历史背景

算术平均是最基本、最常用的一种平均指标，描述数据集中趋势的一个统计指标。它的定义非常简单：对于给定的一组数据 $x_1, x_2, \ldots, x_n$ ，其算术平均值 $A$ 计算公式为：
$A(x_1, x_2, \ldots, x_n) = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{x_1 + x_2 + \cdots + x_n}{n}$

即，将所有数据相加后除以数据的个数。这种计算方法的历史可以追溯到古希腊时期，毕达哥拉斯学派就已经开始研究算术中项的概念。作为最直观、最基础的平均计算方法，算术平均在人类社会的各个领域都有广泛应用，从简单的物品分配到复杂的数据分析。

2.1.2 技术原理与数学原理

算术平均的数学原理基于线性叠加和均分的思想。它假设数据之间存在可加性（additive）关系，这种关系通常被称为线性关系，因为如果将所有数字按升序或降序排列，数字倾向于落在一根直线上。例如，一个简单的等差数列 $1, 3, 5, 7, 9$ ，其算术平均值为 5，正好位于数列的中间位置。

从数学角度看，算术平均具有以下重要性质：

线性性质：对于任意常数 $a$ 和 $b$ ，有 $x_1 + b, a x_2 + b, \ldots, a x_n + b) = a A(x_1, x_2, \ldots, x_n) + b$ 。
最小二乘性质：算术平均是使误差平方和最小的估计值，即 $A$ 是唯一满足 $\sum_{i=1}^{n} (x_i - A)^2$ 最小的数值。
对称性：所有数据点对平均值的贡献是均等的，每个数据点的权重相同。

2.1.3 应用场景与功能点

算术平均的应用极为广泛，主要用于以下场景：

核心功能点 1：反映数据的集中趋势

算术平均可以用来反映一组数据的一般情况，是描述数据集中趋势的基本指标。例如，在教育领域，计算学生的平均成绩；在人口统计中，计算平均年龄、平均身高；在经济领域，计算平均收入等。

核心功能点 2：比较不同数据集

算术平均可以对不同组的数据进行比较，提供一个统一的评价标准。例如，比较不同班级的考试成绩，不同地区的平均气温等。

其他功能点包括：

作为更复杂统计分析的基础，如计算方差、标准差等
在预测模型中作为基准预测值
在工程和科学实验中用于数据平滑处理

2.1.4 示例与实现

示例 1：简单算术平均计算

假设有一组数据：5, 7, 5, 4, 6, 7, 8, 5, 4, 7, 8, 6, 20。其算术平均值计算如下：
$\frac{5+7+5+4+6+7+8+5+4+7+8+6+20}{13} = \frac{92}{13} \approx 7.1$

从这个例子可以看出，算术平均容易受到极大值的影响。在这个数据集中，20 是一个明显的异常值，导致平均值偏高，而大部分数据（10 个）都不超过 7。

示例 2：加权算术平均

在某些情况下，数据集中的各个数据点具有不同的重要性，此时需要使用加权算术平均。若原始数据被分成 $k$ 组，各组的值为 $x_1, x_2, \ldots, x_k$ ，各组频率分别为 $f_1, f_2, \ldots, f_k$ ，则加权算术平均数的计算公式为：
$\frac{\sum_{i=1}^{k} f_i x_i}{\sum_{i=1}^{k} f_i}$

例如，某学生的课程成绩由平时作业（占 30%）、期中考试（占 30%）和期末考试（占 40%）三部分组成。若该学生这三项成绩分别为 90 分、85 分和 95 分，则其课程最终成绩为：
$\times 90 + 0.3 \times 85 + 0.4 \times 95 = 27 + 25.5 + 38 = 90.5$

Python 代码实现

import numpy as np

\# 简单算术平均

data = \[2, 4, 6, 8, 10]

arithmetic\_mean = np.mean(data)

print(f"算术平均值: {arithmetic\_mean}")  # 输出: 6.0

\# 加权算术平均

scores = \[90, 85, 95]

weights = \[0.3, 0.3, 0.4]

weighted\_mean = np.average(scores, weights=weights)

print(f"加权平均值: {weighted\_mean}")  # 输出: 90.5

2.2 几何平均（Geometric Mean）

2.2.1 定义与历史背景

几何平均是另一种计算平均值的方法，适用于对比率、指数等进行平均。对于给定的一组正数 $x_1, x_2, \ldots, x_n$ ，其几何平均值 $G$ 计算公式为：
$G(x_1, x_2, \ldots, x_n) = \sqrt[n]{x_1 \times x_2 \times \cdots \times x_n}$

即，将所有数据相乘后开 $n$ 次方。几何平均的概念最早可以追溯到古希腊时期，毕达哥拉斯学派就已经开始研究几何中项的概念。“几何平均” 这一名称来源于其几何解释：对于给定的矩形，几何平均代表了一个具有相同面积的正方形的边长。

几何平均的历史背景与几何问题密切相关。例如，在几何中，如果让长方形与正方形面积相等，即 $xy = z^2$ ，那么 $z$ 就等于 $\sqrt{xy}$ ，这个就是几何平均数。

2.2.2 技术原理与数学原理

几何平均的数学原理基于乘积关系和几何变换。它假设数据之间存在乘法关系而非加法关系，因此特别适合处理增长率、比率等数据。

从数学角度看，几何平均具有以下重要性质：

对数线性性质：几何平均的对数等于各数据对数的算术平均，即 $\ln G = \frac{1}{n} \sum_{i=1}^{n} \ln x_i$ 。这一性质使得几何平均可以通过对数变换转化为算术平均来计算。
乘积保持性：几何平均保持了数据的乘积关系，即 $G(x_1, x_2, \ldots, x_n)^n = x_1 \times x_2 \times \cdots \times x_n$ 。
尺度不变性：几何平均对数据的尺度变化具有不变性，即 $G(kx_1, kx_2, \ldots, kx_n) = kG(x_1, x_2, \ldots, x_n)$ 。

几何平均的直观解释可以通过几何图形来理解。例如，考虑一个长为 9、宽为 4 的长方形，其面积为 36。几何平均数 6 代表了一个边长为 6 的正方形，其面积与原长方形相等。同样，对于三维情况，几何平均可以理解为与长方体体积相等的立方体的边长。

2.2.3 应用场景与功能点

几何平均主要应用于以下场景：

核心功能点 1：计算平均增长率和比率

几何平均特别适合计算平均增长率、平均比率等具有乘积关系的数据。例如，计算投资回报率、人口增长率、经济增长率等。

核心功能点 2：处理正偏态分布数据

在正偏态分布（如收入分布）中，算术平均数容易受极端大值影响而被拉高，此时几何平均数是一个更合适的替代选择。

其他功能点包括：

用于处理不同尺度的评分数据，避免尺度差异带来的偏差
在金融领域计算投资组合的平均收益率
在生物学中计算生长速率的平均值

2.2.4 示例与实现

示例 1：投资回报率计算

假设某投资在三年内的年收益率分别为 10%、20% 和 30%，计算其平均年收益率：

首先将收益率转换为增长因子：1.10, 1.20, 1.30

几何平均为：
$\sqrt[3]{1.10 \times 1.20 \times 1.30} = \sqrt[3]{1.716} \approx 1.197$

平均年收益率为 $19.7\%$ 。

示例 2：不同尺度评分的平均

假设我们想比较两间咖啡店的在线评价，但评价来自不同的评分系统：咖啡店 A 在五星制中获得 4.5 分，在百分制中获得 68 分；咖啡店 B 在五星制中获得 3 分，在百分制中获得 75 分。使用几何平均进行比较：

咖啡店 A 的几何平均：
$\sqrt{4.5 \times 68} = \sqrt{306} \approx 17.5$

咖啡店 B 的几何平均：
$\sqrt{3 \times 75} = \sqrt{225} = 15$

因此，咖啡店 A 的评价更高。如果使用算术平均，由于百分制数值较大，会导致结果偏向百分制的数值，而几何平均则避免了这一问题。

Python 代码实现

使用 Python 计算几何平均可以通过多种方式实现：

import numpy as np

from scipy import stats

\# 简单几何平均

data = \[2, 4, 8]

geometric\_mean = stats.gmean(data)

print(f"几何平均值: {geometric\_mean}")  # 输出: 4.0

\# 使用对数转换

geometric\_mean\_alternative = np.exp(np.mean(np.log(data)))

print(f"几何平均值(通过对数转换): {geometric\_mean\_alternative}")  # 输出: 4.0

2.3 调和平均（Harmonic Mean）

2.3.1 定义与历史背景

调和平均是另一种计算平均值的方法，适用于处理速率、比率等数据。对于给定的一组正数 $x_1, x_2, \ldots, x_n$ ，其调和平均值 $H$ 计算公式为：
$H(x_1, x_2, \ldots, x_n) = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n}}$

即，先取各数据的倒数，计算其算术平均，然后再取倒数。调和平均的概念同样可以追溯到古希腊时期，毕达哥拉斯学派已经开始研究调和中项的概念。

调和平均的名称来源于音乐中的和声关系。在音乐理论中，调和级数与和声的频率比有关，这也是 “调和” 一词的由来。例如，两个数的调和平均数与它们的倒数有关，这与音乐中的八度和五度等和声关系密切相关。

2.3.2 技术原理与数学原理

调和平均的数学原理基于倒数变换和平衡关系。它假设数据之间存在反比关系，因此特别适合处理与速率、时间、密度等相关的数据。

从数学角度看，调和平均具有以下重要性质：

倒数线性性质：调和平均的倒数等于各数据倒数的算术平均，即 $\frac{1}{H} = \frac{1}{n} \sum_{i=1}^{n} \frac{1}{x_i}$ 。
调和性质：对于两个数 $a$ 和 $b$ ，它们的调和平均数 $H$ 满足 $\frac{1}{H} = \frac{1}{2} \left( \frac{1}{a} + \frac{1}{b} \right)$ ，这与调和级数的性质相关。
反比关系：调和平均对较小的数值更为敏感，这使得它在处理速率和时间等反比关系时特别有用。

调和平均的直观解释可以通过物理问题来理解。例如，考虑一个物体在两段相同距离上以不同速度运动的平均速度问题。假设第一段距离以速度 $v_1$ 行驶，第二段距离以速度 $v_2$ 行驶，则平均速度不是 $\frac{v_1 + v_2}{2}$ ，而是它们的调和平均数 $\frac{2v_1v_2}{v_1 + v_2}$ 。

2.3.3 应用场景与功能点

调和平均主要应用于以下场景：

核心功能点 1：计算平均速度

调和平均特别适合计算相同距离但不同速度的平均速度。例如，一段路，前半段时速 60 公里，后半段时速 30 公里（两段距离相等），则其平均速度为两者的调和平均数 40 公里 / 小时。

核心功能点 2：处理单位比率问题

调和平均用于处理涉及单位比率的平均问题，如单位成本、单位时间等。例如，计算平均价格时，如果每个价格点的购买金额相同，而非购买数量相同，则应使用调和平均。

其他功能点包括：

在金融领域，计算市盈率（P/E 比率）的平均值
在工程中，计算并联电阻的等效电阻（并联电阻的等效电阻是各电阻的调和平均数的一半）
在统计学中，用于计算某些类型的平均值，如调和平均数在机器学习中用于评估模型的准确率和召回率的 F1 分数

2.3.4 示例与实现

示例 1：平均速度计算

假设你开车去商店，去程速度为 30 mph，返程速度为 10 mph（同一路线，距离相同）。整个行程的平均速度计算如下：

$\frac{2}{\frac{1}{30} + \frac{1}{10}} = \frac{2}{\frac{1 + 3}{30}} = \frac{2 \times 30}{4} = 15 \text{ mph}$

真正的行程平均速度，自动根据在每个方向上使用的时间进行调整，是 15 mph。

示例 2：平均价格计算

假设某投资者每年投资固定金额 5000 欧元于某一证券，持续四年，购买价格分别为 80 欧元、75 欧元、70 欧元和 65 欧元。计算平均购买价格：

使用调和平均计算平均价格：
$\frac{4}{\frac{1}{80} + \frac{1}{75} + \frac{1}{70} + \frac{1}{65}} \approx 72.30$

这比使用算术平均计算的 72.5 欧元更准确，因为它考虑了在不同价格下购买的股份数量不同。

Python 代码实现

使用 Python 计算调和平均可以通过多种方式实现：

import numpy as np

from scipy import stats

\# 简单调和平均

data = \[2, 4, 8]

harmonic\_mean = stats.hmean(data)

print(f"调和平均值: {harmonic\_mean}")  # 输出: 3.4285714285714284

\# 手动计算

harmonic\_mean\_manual = len(data) / np.sum(1.0 / np.array(data))

print(f"调和平均值(手动计算): {harmonic\_mean\_manual}")  # 输出: 3.4285714285714284

2.4 平方平均（Quadratic Mean，均方根 RMS）

2.4.1 定义与历史背景

平方平均，也称均方根（Root Mean Square, RMS），是指一组数据的平方的平均数的算术平方根。其计算公式为：
$Q(x_1, x_2, \ldots, x_n) = \sqrt{\frac{x_1^2 + x_2^2 + \cdots + x_n^2}{n}}$

平方平均是 2 次方的广义平均数的表达式，也可称为 2 次幂平均数。平方平均的概念在数学和工程领域有着广泛的应用，特别是在信号处理、电力工程和统计学中。

平方平均的历史背景与物理学中的能量计算密切相关。在物理学中，功率与电压或电流的平方成正比，因此平方平均能够反映信号的能量特性。例如，在电气工程中，均方根值被用来表示交流电的电压和电流的有效值。

2.4.2 技术原理与数学原理

平方平均的数学原理基于平方关系和能量计算。它假设数据的重要性与其平方成正比，因此特别适合处理与能量、功率、波动性等相关的数据。

从数学角度看，平方平均具有以下重要性质：

平方线性性质：平方平均的平方等于各数据平方的算术平均，即 $Q^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2$ 。
距离性质：平方平均与欧几里得距离相关，它代表了数据点到原点的平均距离。
极值敏感性：平方平均对较大的数值更为敏感，因为平方运算会放大较大数值的影响。

平方平均的直观解释可以通过几何图形来理解。例如，考虑一个长为 x、宽为 y 的长方形，其对角线长度为 $\sqrt{x^2 + y^2}$ 。平方平均数 $\sqrt{\frac{x^2 + y^2}{2}}$ 代表了一个边长为 z 的正方形，其对角线长度与原长方形的对角线长度相等。

2.4.3 应用场景与功能点

平方平均主要应用于以下场景：

核心功能点 1：计算信号的有效值

在电气工程和信号处理中，平方平均被用来计算交流电的电压和电流的有效值。有效值是直流电产生相同功率的交流电的电压或电流值。

核心功能点 2：衡量数据的波动程度

平方平均可以用来衡量数据的波动程度或离散程度，特别是在存在正负值的情况下。例如，在统计学中，标准差就是平方平均的一种应用形式。

其他功能点包括：

在音频工程中，用于测量音量和音频信号的强度
在振动分析中，用于评估振动的强度和能量
在金融领域，用于衡量投资回报的波动性

2.4.4 示例与实现

示例 1：电压有效值计算

在电气工程中，交流电的电压通常以均方根值表示。例如，标准的家庭用电电压为 220V（RMS 值），这代表了一个正弦波电压的有效值。假设有一个正弦波电压 $V_{max} \sin(\omega t)$ ，其 RMS 值计算如下：
$V_{RMS} = \sqrt{\frac{1}{T} \int_{0}^{T} V(t)^2 dt} = \frac{V_{max}}{\sqrt{2}}$

对于标准 220V 的交流电，其峰值电压约为 $220 \times \sqrt{2} \approx 311V$ 。

示例 2：数据波动性比较

考虑两组数据：

组 A: [1, 3, 5, 7, 9]

组 B: [4, 4, 5, 6, 6]

计算它们的平方平均：

组 A 的平方平均：
$Q_A = \sqrt{\frac{1^2 + 3^2 + 5^2 + 7^2 + 9^2}{5}} = \sqrt{\frac{1 + 9 + 25 + 49 + 81}{5}} = \sqrt{\frac{165}{5}} = \sqrt{33} \approx 5.7446$

组 B 的平方平均：
$Q_B = \sqrt{\frac{4^2 + 4^2 + 5^2 + 6^2 + 6^2}{5}} = \sqrt{\frac{16 + 16 + 25 + 36 + 36}{5}} = \sqrt{\frac{129}{5}} = \sqrt{25.8} \approx 5.0794$

尽管两组数据的算术平均都是 5，但组 A 的平方平均更大，反映了其数据点离平均值的距离更大，即波动性更强。

Python 代码实现

使用 Python 计算平方平均可以通过多种方式实现：

import numpy as np

\# 简单平方平均

data = \[3, 4, 5]

quadratic\_mean = np.sqrt(np.mean(np.square(data)))

print(f"平方平均值: {quadratic\_mean}")  # 输出: 4.08248290463863

\# 另一种实现方式

quadratic\_mean\_alternative = np.linalg.norm(data) / np.sqrt(len(data))

print(f"平方平均值(另一种方式): {quadratic\_mean\_alternative}")  # 输出: 4.08248290463863

三、四种均值的比较与分析

3.1 均值不等式与相互关系

四种均值之间存在严格的大小关系，称为均值不等式：
$\leq G \leq A \leq Q$

即，调和平均小于等于几何平均，几何平均小于等于算术平均，算术平均小于等于平方平均(9)。这一关系对任何正数数据集都成立，当且仅当所有数据相等时，等号成立。

从几何角度看，这四种均值可以通过不同的几何条件来解释：

算术平均：当长方形与正方形周长相等时，正方形的边长即为算术平均。
几何平均：当长方形与正方形面积相等时，正方形的边长即为几何平均。
平方平均：当长方形与正方形对角线长度相等时，正方形的边长即为平方平均。
调和平均：当长方形和正方形面积周长的比例一样时，正方形的边长即为调和平均。

这一不等式关系在实际应用中具有重要意义，它帮助我们理解不同均值的特性和适用场景。例如，当数据存在较大的波动时，平方平均会比算术平均更大，反映了其对极端值的敏感性。

3.2 对比表格

下面的表格总结了四种均值的主要特点和区别：

均值类型	计算公式	核心应用场景	对极端值的敏感性	数据要求	数学性质
算术平均	$\frac{1}{n} \sum_{i=1}^{n} x_i$	数据集中趋势分析、简单平均	高	无特殊要求（可含零和负数）	线性性、最小二乘性
几何平均	$\sqrt[n]{\prod_{i=1}^{n} x_i}$	增长率、比率平均、几何问题	中	所有数据必须为正数	对数线性性、乘积保持性
调和平均	$\frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}}$	平均速度、单位比率问题	低	所有数据必须为正数	倒数线性性、调和性质
平方平均	$\sqrt{\frac{1}{n} \sum_{i=1}^{n} x_i^2}$	有效值计算、波动性分析	极高	无特殊要求（可含零和负数）	平方线性性、距离性质