解题思路
问题一
在第一问,题目要求找到35200个景点中评分的最高分,并对最高分的景点数按照城市进行统计。最后得出拥有最高评分景点数量的前十个城市。在这一问中,主要选手的考察数据查询能力,按照题目的要求遍历各个表格进行查询即可。
问题二
在第二问中,要求遵循城市最佳景点游览原则,结合多个因素对352个城市进行综合评价,选出50个城市。在这道题中,需要建立一个综合评价模型对多个因素进行综合评价。在这里可以考虑建立AHP-TOPSIS模型或者熵权法-TOPSIS模型。在构建各个城市的评分指标表格后,可以基于因子分析法或者主成分分析法进行降维,然后利用所构建的综合评价模型计算各个城市的评分。
问题三
在第三问中,假设一名游客从广州入境,要求建立一个优化模型,优化目标是在144小时内游玩尽可能多的城市,同时要求综合游玩体验最好。在这里需要建立一个游玩体验的评价模型,以计算第二个目标值。模型的约束条件包括:需要遵循城市最佳景点游览原则,且交通方式只能选择高铁,同时解空间被限制在50个最令外国游客向往的城市内。对于这一问,可以建立一个双目标优化模型,并通过NSGA-Ⅱ等多目标优化算法进行求解。
问题四
在第四问中,要求将优化目标改为既要尽可能的游览更多的城市,又需要使门票和交通的总费用尽可能的少。对于这个问题,可以直接对问题三中的双目标优化模型进行修改,然后同样基于一样的方法进行求解。
问题五
在第五问中,要求将游览的目的地改为山景。在这一问中,可选的旅游城市不再局限于50个城市,故需要先对有山景的城市进行筛选,然后划定解空间的范围。这一问的优化目标为:尽可能浏览更多的山以及总费用更小。约束条件包括每个城市只能游玩一座评分最高的山,而且不同城市之间的交通方式只能选择高铁,所以在这一问中只能选择高铁可以到达的城市。在明确解空间后,可以建立双目标优化模型并基于多目标优化算法进行求解。
代码
问题一
(1)使用python遍历每一个.csv文件并将其合并为一个文件
(2)对缺失值和异常值进行处理
(3)基于DSA(Data Structure Analysis)得出最大值,画出数据分布直方图 (解决 BS是多少?全国有多少个景点获评了BS)


(4)基于DT(decision tree)-Spearman得出 获评BS景点最多的城市,相关性越高获评越多。(DT对数据进行分类,分类因素有两个:城市和得分;然后将分类结果作spearman相关性分析。)


Score 三沙 五家渠 玉溪 益阳 天门 阿拉尔 大兴安岭 潍坊 烟台 邢台
5 36 28 21 20 19 18 18 18 18 17
 

# 导入软件包
import pandas as pd
import numpy as np

from sklearn.tree import DecisionTreeClassifier
import seaborn as sns
import matplotlib.pyplot as plt

# 热力图可视化

# 1. 过滤掉警告的意思
import warnings
warnings.filterwarnings("ignore")

# 2. 导入数据

data=pd.read_excel('hsc.xlsx')

# 3. 用来查看数据框的列名
data.head()

# 图片显示中文
plt.rcParams['font.sans-serif']=['SimHei']
# 减号unicode编码
plt.rcParams['axes.unicode_minus'] =False
# 删除无关的列
data.drop([], axis=1, inplace=True)

# 4. 计算各变量之间的相关系数
corr = data.corr(method='spearman')


# 5. 调整画布大小
ax = plt.subplots(figsize=(9, 9))

# 6. 画热力图   annot=True 表示显示系数
ax = sns.heatmap(corr, vmax=.9, square=True, annot=False, cmap="YlGnBu")

# 7. 设置刻度字体大小
plt.xticks(fontsize=8)
plt.yticks(fontsize=8)
plt.show()



2025 年华数杯 C 题 “可调控生物节律的 LED 光源研究” 思路分析
问题 1:光谱核心参数计算模型
目标:基于给定的光谱功率分布(SPD),计算 5 个核心参数:相关色温(CCT)、距离普朗克轨迹的距离(Duv)、保真度指数(Rf)、色域指数(Rg)、褪黑素日光照度比(mel-DER)。

  1. 颜色特性参数(CCT、Duv)
  • 步骤 1:SPD 转换至 CIE XYZ 色彩空间根据 CIE 标准观察者光谱三刺激值(\(\bar{x}(\lambda), \bar{y}(\lambda), \bar{z}(\lambda)\)),通过积分计算三刺激值:\(X = \int_{\lambda_{\text{min}}}^{\lambda_{\text{max}}} \text{SPD}(\lambda) \cdot \bar{x}(\lambda) d\lambda\)\(Y = \int_{\lambda_{\text{min}}}^{\lambda_{\text{max}}} \text{SPD}(\lambda) \cdot \bar{y}(\lambda) d\lambda\)\(Z = \int_{\lambda_{\text{min}}}^{\lambda_{\text{max}}} \text{SPD}(\lambda) \cdot \bar{z}(\lambda) d\lambda\)(实际计算中用离散波长点的数值积分实现)。
  • 步骤 2:计算色坐标与普朗克轨迹匹配由 XYZ 计算色坐标 \((x, y) = (X/(X+Y+Z), Y/(X+Y+Z))\)。参考 [1][5],通过迭代法或插值法在普朗克轨迹(黑体辐射曲线)上寻找与 \((x, y)\) 最近的点,确定 CCT;Duv 为色坐标偏离普朗克轨迹的距离(量化 “偏色” 程度)。
  • 颜色还原参数(Rf、Rg)
  • 选取 99 个标准色样,计算每个色样在待测光源和参考光源下的色坐标(基于 CIE LAB 或 CIE CAM02 色彩空间)。
  • 计算色样的色位移(色差),Rf 为衡量整体颜色还原准确性的指数(越接近 100 越好),Rg 为衡量色域范围的指数(与参考光源色域的比值)。
  • 基于 ANSI/IES TM-30 方法 [2],核心是对比待测光源与参考光源对标准测试色样的颜色还原差异:
  • 生理节律参数(mel-DER)
  • 参考 CIE S 026/E 标准 [3],基于视网膜感光神经节细胞(ipRGC)的响应特性,使用 melanopic 光效能函数 \(s_{\text{mel}}(\lambda)\) 计算:\(\text{melanopic 照度} = \int_{\lambda_{\text{min}}}^{\lambda_{\text{max}}} \text{SPD}(\lambda) \cdot s_{\text{mel}}(\lambda) d\lambda\)mel-DER 为待测光源与日光的 melanopic 照度比值,量化对褪黑素分泌的抑制强度(值越低,干扰越小)。

问题 2:多通道 LED 光谱优化合成
目标:通过 5 个 LED 通道(深红光、绿光、蓝光、暖白光 WW、冷白光 CW)的权重组合,合成满足两个场景需求的光谱。
 

  1. 核心模型合成光谱为各通道 SPD 的加权叠加:\(\text{SPD}_{\text{合成}}(\lambda) = \sum_{i=1}^5 w_i \cdot \text{SPD}_i(\lambda)\)其中 \(w_i\) 为第 i 通道的权重(\(w_i \geq 0\),通常归一化 \(\sum w_i = 1\))。
  2. 场景一:日间照明模式
  • 约束:CCT ∈ [5500K, 6500K],Rg ∈ [95, 105],Rf > 88。
  • 目标:最大化 Rf(颜色还原保真度)。
  • 优化方法:采用数值优化算法(如遗传算法、粒子群优化),以 \(w_1,...,w_5\) 为变量,在约束范围内搜索使 Rf 最大的权重组合。
  • 场景二:夜间助眠模式
  • 约束:CCT ∈ [2500K, 3500K],Rf ≥ 80。
  • 目标:最小化 mel-DER(减少对褪黑素的抑制)。
  • 优化方法:同上,目标函数改为最小化 mel-DER,在约束下求解最优权重。

问题 3:模拟太阳光谱的动态控制策略
目标:用 5 通道 LED 合成光谱,模拟一天中太阳光谱(8:30-19:30)的节律变化。
 

  1. 分析太阳光谱特性提取太阳光谱的关键参数(CCT、mel-DER、Rf、Rg)随时间的变化规律(如早晨 CCT 低、mel-DER 中等;正午 CCT 高、mel-DER 强;傍晚 CCT 回落)。
  2. 动态权重控制策略
  • 将时间序列离散化(如每 30 分钟一个节点),对每个时间点,以太阳光谱参数为目标,求解 5 通道权重(方法同问题 2 的优化模型),使合成光谱参数与太阳光谱参数误差最小。
  • 建立权重随时间的连续函数(如插值),实现平滑过渡。
  • 案例分析选取早晨(8:30)、正午(12:00)、傍晚(19:30)三个时间点,绘制合成光谱与太阳光谱的 SPD 曲线对比图,验证关键参数(CCT、mel-DER 等)的匹配度。

问题 4:睡眠实验数据的统计分析
目标:评估 “优化光照”(环境 A)对睡眠质量的改善效果。
 

  1. 计算睡眠指标基于原始数据(每 30 秒睡眠阶段记录),计算 6 个核心指标:
  • 总睡眠时间(TST):非清醒阶段(4)的总时长;
  • 睡眠效率(SE):TST / 总记录时间 × 100%;
  • 入睡潜伏期(SOL):关灯到首次进入睡眠阶段(2、3、5)的时间;
  • 深睡眠比例(N3%):N3 阶段时长 / TST × 100%;
  • REM 睡眠比例(REM%):REM 阶段(5)时长 / TST × 100%;
  • 睡眠后清醒次数(Number):睡眠开始后清醒(4)的次数。
  • 统计检验
  • 数据类型:11 位被试在 3 种环境下的重复测量数据,适用重复测量方差分析(ANOVA)(若满足正态性)或Friedman 非参数检验(若不满足)。
  • 事后检验:用 Tukey HSD 或 Wilcoxon 符号秩检验,比较环境 A 与 B、A 与 C 的差异,判断 A 是否显著改善睡眠指标(如 SE 更高、SOL 更短、N3% 更高等)。
  • 结论基于统计结果,判断 “优化光照”(A)相比普通光照(B)和黑暗(C)是否对睡眠质量有显著有益影响。


总结:问题 1 是基础参数计算,问题 2 是多目标优化,问题 3 是动态控制,问题 4 是统计验证,四者层层递进,需严格遵循国际标准(CIE、IES)的计算方法,确保模型的准确性和可靠性。

通过网盘分享的文件:2025华数杯资料

链接: https://pan.baidu.com/s/1C-iT1wy8VUT64Ia_phXXmA 提取码: cndr

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐