山东大学软件学院数字媒体技术机器学习基础期末部分题回忆版(2023级2026年考试)
概念解释(4*5)
准确率
核技巧
5折交叉验证
过拟合
梯度下降
简答题(8*5)
最小二乘法的思想? 当特征大于样本数(d>m)的时候直接用最小二乘法会出现什么数学问题? 如何解决? (我题都没咋读懂, 表述可能有偏差)
C4.5采用了增益率, 为什么使用增益率? 解决了信息增益的什么问题?
K-Mean的局限性( 至少三条 ) 如何改进?( 至少一条 )
KNN为什么被称为懒惰算法? K很大(如K=N)或K很小(如K=1)时分别会导致过拟合还是欠拟合, 解释原因
SVM软间隔硬间隔区别? 软间隔损失函数中正则化系数C过大会导致过拟合还是欠拟合, 解释原因
综合题(20)
朴素贝叶斯
(1)朴素贝叶斯如何根据后验概率(P(c|x))来进行分类?
(2)采样时, 一个样本中的某个属性值缺失改如何处理
(3)给了个表, 问根据朴素贝叶斯 颜色=青绿, 敲声=沉闷 是好瓜还是坏瓜
(我没记错的话应该如图)

综合题(20)
(1)从误差和方差的角度, bagging和boosting算法分别解决了哪个? 解释直观原因
(2)随机森林是对bagging的改进, 除了重采样还在哪个环节引入了随机性? 有什么好处
(3)AdaBoost作为集成算法,是怎么对每一轮的训练权重进行处理的,请说明adaboost的基本思想
------------------------------------------------------------------------------------------------------------------------------------
往年题不是这样的!!!
又双被创了...
算了挂不了
大伙一定要秉持着一不怕苦二不怕死的精神把这种真题的开源精神传承下去
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)