[数学建模从入门到入土] 评价模型

静影ˇ屠苏

666人浏览 · 2026-01-26 22:48:17

静影ˇ屠苏 · 2026-01-26 22:48:17 发布

[数学建模从入门到入土] 评价模型

个人导航

知乎：https://www.zhihu.com/people/byzh_rc

CSDN：https://blog.csdn.net/qq_54636039

注：本文仅对所述内容做了框架性引导，具体细节可查询其余相关资料or源码

参考文章：各方资料

评价类问题

针对多个候选对象(方案, 产品, 项目, 政策, 指标集)或多个维度的表现(性能, 成本, 风险, 收益)进行综合比较和衡量, 从而得到合理的等级划分排序

在这里插入图片描述

标准化
确定权重

标准化

重要性:

消除量纲影响
统一取值范围

1. min-max normalization

缩放到0-1区间

对于越大越好的:
$\frac{x - x_{\min}}{x_{\max} - x_{\min}}$
对于越小越好的:
$\frac{x_{\max} - x}{x_{\max} - x_{\min}}$

优点: 简单直观
缺点: 异常值敏感

2. mean normalization

缩放到-1-1区间, 均值为0
$\frac{x - \mu}{x_{\max} - x_{\min}}$

优点: 简单直观, 保留数据中心化
缺点: 异常值敏感

3. z-score normalization

均值为0, 方差为1的标准正态分布 (适用于消除异常值影响)
$\frac{x - \mu}{\sigma}$

优点: 适用于正态分布的数据
缺点: 不适用于正态分布的数据; 异常值敏感

4. vector normalization

适用于欧几里得空间中的多维数据 (x除以其模长)
$\frac{x}{\sqrt{\sum_{i=1}^n x_i^2}}$

优点: 适用于计算欧几里得距离(文本分类, 图像处理)
缺点: 不适用于需要保留数据间原有比例关系的场景

5. score normalization

缩放, 用于评分系统
$\frac{x}{\sum_{i=1}^n x_i}$

优点: 直观, 用于评分
缺点: 不适用于需要保留数据绝对值的场景; 极端值敏感

6. log

适用于数据分布高度偏斜 (+1避免对数零的情况)
$\log(x+1)$

优点: 适用于高度偏斜的数据
缺点: 对非正值无效

确定权重

1.主观赋权

专家经验

层次分析AHP
模拟层次分析
德尔菲法

2.客观赋权

数据本身

熵权法EWM
因子分析
变异系数法

3.组合赋权

加权平均法
乘法融合法
优化模型

层次分析AHP

建立递阶层次结构模型
构造出各层次中的所有判断矩阵
( $a_{ij}$ : 第i个指标相对第j个指标的重要程度)
一致性检验
求权重后进行评价
(各指标乘以其对应的权重, 加和得到总分)

例子:

熵权法EWM

对于某个指标, 可以用熵值来判断某个指标的离散程度
信息熵值越小, 指标的离散程度就越大, 该指标的影响/权重就越大
(如果某项指标的值都相等, 则该指标不起作用)
(依据的原理: 指标的变异程度越小, 其反映的信息量越少, 对应的权重越低)

数据标准化
$z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^n}x_{ij}^2}$
计算第j个指标下, 第i个样本所占的比重
$p_{ij}=\frac{\widetilde{z_{ij}}}{\sqrt{\sum_{i=1}^n}\widetilde{z_{ij}}}$
计算熵权
$e_j = -\frac{1}{\ln n}\sum_{i=1}^n p_{ij} \ln(p_{ij}) \quad (j = 1,2,...,m) \\ d_j = 1 - e_j \\ W_j = \frac{d_j}{\sum_{j=1}^m d_j}$

除以 $\ln n$ 是为了使信息熵始终在[0,1]区间

由于信息熵 $e_j$ 越大, 其信息效用越小, 所以需要用1来减
-> 信息效用 $d_j$ 越大, 其权重 $W_j$ 越大

例子:

组合赋权法

线性加权平均法:
设定参数 $α, β$ 且 $α + β = 1$ ，则
$W^* = αW_{AHP} + βW_{EWM}$
可根据决策者对主客观判断的信任度调节 $α, β$
乘法组合法:
将对应指标的AHP和EWM权重相乘后归一化
$w_i^* = \frac{w_i^{AHP} \cdot w_i^{EWM}}{\sum_j w_j^{AHP} \cdot w_j^{EWM}}$
若两种方法对同一指标权重均高，则综合后该指标权重更突出

准备数据：已有指标数据并通过 AHP 求得 $W_{AHP}$ ，通过 EWM 求得 $W_{EWM}$
选择组合策略：根据需求选择加权平均法或乘法组合法
计算综合权重
归一化处理：若计算后 $\Sigma w≠1$ ，则归一化使 $\Sigma w^*=1$
验证与分析：比较 $w^*$ 与 $W_{AHP},W_{EWM}$ ，分析组合后权重的变化特性

逼近理想解排序法TOPSIS

通过计算各方案与理想解和负理想解的距离, 对多个方案进行排序

核心思想: 最优方案应该同时最接近理想解和最原理负理想解

TOPSIS基于欧几里得距离

e.g. 供应商的选择, 投资策略, 资源分配

数据标准化(x->z)
加权处理(z->v)
确定理想解和负理想解
(分别计算各指标的最优值和最劣值)
$\text{理想解:}\quad A^+ = \left(\max(v_{i1}), \max(v_{i2}), \dots, \max(v_{in})\right) \\ \text{负理想解:}\quad A^- = \left(\min(v_{i1}), \min(v_{i2}), \dots, \min(v_{in})\right)$
计算距离
$D_i^+: \text{第i个方案与理想解的欧几里得距离} \\ D_i^-: \text{第i个方案与负理想解的欧几里得距离}$
计算贴近度
(贴近度越大, 方案越优)
$C_i = \frac{D_i^-}{D_i^+ + D_i^-}$

例子:

import numpy as np

def normalize_data(data, criteria_types):
    normalized_data = np.zeros_like(data, dtype=float)
    n, m = data.shape

    for j in range(m):
        column_data = data[:, j]
        if criteria_types[j] == 1:  # 正向指标
            normalized_data[:, j] = (
                (column_data - np.min(column_data)) / (np.max(column_data) - np.min(column_data))
            )
        else:  # 逆向指标
            normalized_data[:, j] = (
                (np.max(column_data) - column_data) / (np.max(column_data) - np.min(column_data))
            )
    return normalized_data

def weighted_normalization(normalized_data, weights):
    # todo
    normalized_data = np.asarray(normalized_data, dtype=float)
    weights = np.asarray(weights, dtype=float)

    if normalized_data.ndim != 2:
        raise ValueError("normalized_data 必须是二维矩阵 (n, m)")
    if weights.ndim != 1:
        raise ValueError("weights 必须是一维向量 (m,)")
    if normalized_data.shape[1] != weights.shape[0]:
        raise ValueError(f"维度不匹配: normalized_data.shape={normalized_data.shape}, weights.shape={weights.shape}")

    w_sum = weights.sum()
    if not np.isfinite(w_sum) or w_sum <= 0:
        raise ValueError("weights 之和必须为正且有限")
    # 如果你希望权重一定归一化，可以保留这句
    weights = weights / w_sum

    return normalized_data * weights
def calculate_ideal_solutions(weighted_data):
    ideal_solution = np.max(weighted_data, axis=0)
    negative_ideal_solution = np.min(weighted_data, axis=0)
    return ideal_solution, negative_ideal_solution

def calculate_distances(weighted_data, ideal_solution, negative_ideal_solution):
    n = weighted_data.shape[0]
    d_plus = np.zeros(n)
    d_minus = np.zeros(n)

    for i in range(n):
        d_plus[i] = np.sqrt(np.sum((weighted_data[i] - ideal_solution) ** 2))
        d_minus[i] = np.sqrt(np.sum((weighted_data[i] - negative_ideal_solution) ** 2))

    return d_plus, d_minus

def calculate_closeness(d_plus, d_minus):
    return d_minus / (d_plus + d_minus)

data = np.array([
    [100, 8, 10],
    [150, 7, 8],
    [120, 9, 12]
])

criteria_types = [-1, 1, -1]

weights = np.array([0.4, 0.3, 0.3])

normalized_data = normalize_data(data, criteria_types)
print("标准化后的数据：")
print(normalized_data)

weighted_data = weighted_normalization(normalized_data, weights)
print("\n加权标准化后的数据：")
print(weighted_data)

ideal_solution, negative_ideal_solution = calculate_ideal_solutions(weighted_data)
print("\n理想解：", ideal_solution)
print("负理想解：", negative_ideal_solution)

d_plus, d_minus = calculate_distances(weighted_data, ideal_solution, negative_ideal_solution)
print("\n与理想解的距离：", d_plus)
print("与负理想解的距离：", d_minus)

closeness = calculate_closeness(d_plus, d_minus)
print("\n各方案的贴近度：", closeness)


suppliers=["供应商A", "供应商B", "供应商C"]
ranking = sorted(zip(suppliers, closeness), key=lambda x: x[1], reverse=True)
print("\n推荐排序：")
for i, (supplier, score) in enumerate(ranking, 1):
    print(f"{i}. {supplier}: {score:.4f}")

补充-一致矩阵

对于正互反矩阵A: $A\in\mathbb{R}^{n\times n}$
$\begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{bmatrix}$

$a_{ij}>0,\quad a_{ii}=1,\quad a_{ij}=\frac{1}{a_{ji}}$

其为一致矩阵的充要条件是:
$\begin{cases} a_{ij} > 0 & \text{所有元素均大于 0} \\ a_{11} = a_{22} = \dots = a_{nn} = 1 & \text{对角线元素均为 1} \\ \left[ a_{i1}, a_{i2}, \dots, a_{in} \right] = k_i \left[ a_{11}, a_{12}, \dots, a_{1n} \right] & \text{矩阵每行成比例(r(A)=1)} \end{cases}$
故而, 一致矩阵只有一个特征值 $n$ , 其余为0

特征值为n时, 其特征向量对应为:
$\begin{bmatrix} \frac{1}{a_{11}} \\ \frac{1}{a_{12}} \\ \vdots \\ \frac{1}{a_{1n}} \end{bmatrix}, \quad k \ne 0$
推论: n阶正互反矩阵A为一致矩阵当且仅当最大特征值 $\lambda_{max}=n$

若正互反矩阵A的最大特征值 $\lambda_{max}>n$ , 则需要一致性检验(判断该矩阵的一致性是否在接受范围内)

补充-层次分析法若未通过一致性检验

1.算术平均法求权重

第一步：将判断矩阵按照列归一化（每一个元素除以其所在列的和）
第二步：将归一化的各列相加（按行求和）
第三步：将相加后得到的向量中每个元素除以n即可得到权重向量

假设判断矩阵:
$\begin{bmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{n1} & \dots & a_{nn} \end{bmatrix}$

那么算术平均法求得的权重向量:
$w_i = \frac{1}{n}\sum_{j=1}^n \frac{a_{ij}}{\sum_{k=1}^n a_{kj}} \quad (i = 1,2,3,...,n)$

2.几何平均法求权重

第一步：将判断矩阵的各行元素相乘得到的值组成一个列向量
第二步：将得到的列向量的每个分量开n次方
第三步：对该列向量进行归一化即可得到权重向量

假设判断矩阵:
$\begin{bmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{n1} & \dots & a_{nn} \end{bmatrix}$

那么几何平均法求得的权重向量:
$w_i = \frac{\left(\prod_{j=1}^n a_{ij}\right)^{\frac{1}{n}}}{\sum_{k=1}^n \left(\prod_{j=1}^n a_{kj}\right)^{\frac{1}{n}}} \quad (i = 1,2,...,n)$

3.特征值法求权重

一致矩阵有一个特征值 $n$ ，其余特征值均为 $0$
另外，我们很容易得到，特征值为 $n$ 时，对应的特征向量刚好为权重向量
假如我们的判断矩阵一致性可以接受，那么我们可以仿照一致矩阵权重的求法

第一步：求出矩阵 $A$ 的最大特征值 $\lambda_{max}$ 以及其对应的特征向量 $x$
第二步：对求出的特征向量进行归一化即可得到我们的权重

$(A-\lambda_{max}E)x=0$

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

机器人-从“性能参数领先”转向“工业化能力领先”

DAMO开发者矩阵

一文吃透LangChain核心概念与完整生态体系

随着大模型技术快速迭代，单纯调用模型API的开发方式早已无法满足企业级需求。原生大模型存在无长期记忆、无法对接外部数据、不能自主调用工具、流程不可控、无法溯源调试等痛点，很难落地复杂业务场景，比如智能知识库、自动化办公Agent、多轮对话机器人、智能数据分析等。而LangChain的出现，完美解决了大模型应用落地的核心难题。截至2026年，LangChain GitHub星标超9万，月下载量数百万