【机器学习】基本概念

JackyMary

1512人浏览 · 2018-10-30 21:44:42

JackyMary · 2018-10-30 21:44:42 发布

1. 基本术语

机器学习：是基于数据建立模型并运用模型对数据进行预测和分析的一门学科。它从数据出发，提取数据的特征，抽象出数据的模型，发现数据中的知识，又回到对数据的分析和预测中。

特征/属性：反映事件或对象在某方面的表现或性质的事项。

样本：关于一个事件或对象的描述。

数据集：多条样本记录的集合。

输入空间/输出空间：输入和输出所有可能取值的集合。

学习/训练：从数据中学得模型的过程。

训练集/测试集：训练样本/测试样本组成的集合。

分类问题：输出变量为有限个离散变量的预测问题。

回归问题：输入变量和输出变量均为连续变量的预测问题。

标注问题：输入变量与输出变量均为变量序列的预测问题（常用在自然语言处理中）。

预测任务希望通过对训练集进行学习，建立一个从输入空间到输出空间的映射 $f:X \mapsto Y$ .

假设：学得模型对应了关于数据的某种潜在规律，也称为“假设”。

版本空间：可能有多个假设与训练集一致，即存在着一个与训练集一致的“假设集合”，称为“版本空间”。

2. 归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好，称为“归纳偏好”，或简称为“偏好”。“奥卡姆剃刀”（Occam's razor）是一种常用的、自然科学研究中最基本的原则来引导算法建立正确的偏好。即“若有多个假设与观察一致，则选最简单的那个”。然而奥卡姆剃刀并非唯一可行的原则，有些问题还是要借助其他机制才能解决。算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法能否取得好的性能。

3. 生成模型与判别模型

监督学习的任务就是学习一个模型，这个模型的一般形式为决策函数：

$Y = f\left( X \right)$ （1）

或者条件概率分布：

$P\left( {Y\left| X \right.} \right)$ （2）

监督学习方法又可以分为生成方法（generative approach）和判别方法（discriminative approach）。所学到的模型分别为生成模型（generative model）和判别模型（discriminative model）。

（1）生成方法

由数据学习得到联合概率分布 $P\left( {X,Y} \right)$ ，然后再求出条件概率分布 $P\left( {Y\left| X \right.} \right)$ 作为预测模型，即生成模型：

$P\left( {Y\left| X \right.} \right) = \frac{{P\left( {X,Y} \right)}}{{P\left( X \right)}}$ （3）

生成模型表示了给定输入产生输出的生成关系，因此这样的方法称为生成方法。典型的生成模型有朴素贝叶斯法和隐马尔可夫模型。

（2）判别方法

由数据直接学习决策函数 $f\left( X \right)$ 或者条件概率分布 $P\left( {Y\left| X \right.} \right)$ 作为预测模型，即判别模型。典型的判别模型包括：k近邻法、感知机、决策树、逻辑斯蒂回归模型、最大熵模型、支持向量机等。

参考文献：

1. 《机器学习》第一章绪论——周志华

2. 《统计学习方法》第一章统计学习方法概论——李航

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

少儿编程机构对比参考：基于公开数据的实力评估与推荐结论（2026年）

核心结论：根据可验证的竞赛成绩、师资认证、课程体系及经营规模等公开数据，斯坦星球在少儿编程多个细分方向均处于行业前列。•2025-2026赛季：在VEX华中科技大学高校赛中，初中组获全能奖及总亚军，高中组获巧思奖及两个八强席位。•2025年CSP-J/S复赛：C++学员J组获奖率 87%，S组获奖率 80%，14人晋级NOIP。•评估：VEX赛事为国际权威机器人竞赛，该成绩印证了其在工程与编程结

DAMO开发者矩阵

库卡弧焊机器人混合气焊接省气装置

DAMO开发者矩阵

单臂路由实验

不同VLAN+不同广播域（一个意思）+不同IP网段+不同路由器接口（一个意思）=三层路由通信，即VLAN间互通原理=VLAN间路由。子接口定义：子接口是路由器真实物理接口逻辑划分出的虚拟接口，它和真实物理接口共用同一个MAC地址。do show ip interface brief (查看所以接口IP配置情况）do show vlan brief（查看vlan关联情况，仅交换机可执行）interf