本篇为智能科学与技术-专业课机器学习-26年期中考试试题(个人回忆版),虽然现在忙着考研,但是想到机器学习这门课网上还没有真题,复习就只能看PPT、课本,如果我做了,下一届学弟学妹们就可以有真题可以参考,那也算做了一件好事,毕竟计算机的灵魂就是开源

机器学习期中考试

一、判断选择

  1. 决策树和神经网络训练中都会有过拟合的问题(有点忘了原题了主要就是过拟合)
  2. 决策树选择属性时,信息增益率比信息增益更有效
  3. 单层感知机无法正确处理异或问题
  4. 过拟合相关判断
  5. Bootstrap方法

A 从n个属性中有放回选取n´个属性

B 从n个属性中无放回选取n´个属性

C 从m个数据中有放回选取m´个数据

D 从m个数据中无放回选取m´个数据



 

二、

  1. 类别不平衡的数据,现有数据集,一类数据占比90%,另外一类占比10%,我们可以很轻松的得到准确率为90%的模型,但是另一类数据的准确率为0,请问如何处理本题类别不平衡的问题
  2. 信息增益偏向于取值多的属性,解释原因,怎么做可以缓解该问题?

三、机器学习的评估方法有哪些,说出他们的优缺点

四、 某个疾病的判断,医生的错误率为10%

(1)训练集错误率8%,验证集错误率25%,用什么方案解决,为什么

(2)训练集错误率25%,验证集错误率30%,用什么方案解决,为什么

五、对于数量少的数据集,采用什么评估方法,为什么?

六、

x1(2,  2)  x2(3 , 5)  x3(1 , 0)

且x1 x2为正例,x3为反例  η=1

误分类点公式  -yi ( wxi + b ) >0

w<---w+η yi xi

b<---b+ηyi

求w和b的最终值

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐