目录

3-计算机视觉技术及应用

3.1-计算机视觉定义及概述

3.2-计算机视觉的主要研究内容

3.3-人工智能与深度学习


第三章 计算机视觉技术及应用

3.1-计算机视觉定义及概述

  1. 计算机视觉:信号处理理论与计算机出现后,人们试图用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程。➡️ 形成新兴的学科:计算机视觉。
  2. 数字图像:
    1. 二维图像,用有限数字数值像素的表示,用数组/矩阵表示,其光照位置和强度都是离散的
    2. 数字图像是由模拟图像数字化得到的,以像素为基本元素,可以用数字计算机存储和处理的图像
  3. 数字图像处理:将图像信号转化为数字信号,并用计算机对其处理
  4. 图像处理 🆚 计算机视觉
    1. 图像处理:人是最终解释者。对图像操作,以提高图像质量、恢复图像以及压缩解压图像
    2. 计算机视觉:计算机是图像的解释者。使计算机具有通过二维图像认知三维环境的能力,图像处理是计算机视觉达到其目的所使用的技术
  5. 视觉计算理论—视觉系统研究的三个层次:计算理论 ➡️ 表示与算法 ➡️ 硬件实现
  6. 视觉计算理论—视觉信息处理的三个阶段:
    1. 基元图:图像的密度变化可能与物体边界这类具体的物理性质相对应,因此主要描述图像的密度变化及其局部几何关系
    2. 2.5维图:以观察者为中心,描述可见面的方位、轮廓、深度及其他性质
    3. 3维模型:以物体为中心,用来处理和识别的三维形状表象

3.2-计算机视觉的主要研究内容

  1. 计算机视觉研究内容
    1. 图像获取
    2. 摄像机标定:从摄像机获取的信息出发,计算三维空间中物体的几何信息,并由此重建和识别物体。而空间物体表面某点的三维几何位置,与其在图像中对应点之间的相互关系,是由摄像机成像的几何模型才能决定,几何模型即为摄像机参数。获得参数的实验过程叫做摄像机标定。
    3. 纹理分析
      1. 纹理标志三要素:局部序列性;这些序列由基本部分非随机排列组成;各部分大致都是均匀的统一体
      2. 一般认为,纹理就是指在图像中反复出现的局部模式和排列规则
      3. 过程:提取纹理特征参数
    4. 对象检测和识别
    5. 特征检测:
      1. 概念:表征图像所蕴含语义的属性数据
      2. 目的:为了让计算机具有认识/识别图像的能力
      3. 常见的图像特征:焦点、边缘、直线和纹理
    6. 立体视觉;从2个或多个视点观察同一个物体,以获取在不同视觉下的感知图像,通过三角测量原理计算图像像素的位置偏差来获取物体的三维信息。是由多幅图像获取物体三维信息的方法,是计算机视觉的一个重要分支。
    7. 运动估计
    8. 图像分割

3.3-人工智能与深度学习

  1. 深度学习
    1. 本质:通过构建多隐层的模型和海量训练数据(可为无标签数据),来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型” 是手段,“特征学习” 是目的。

      转载—隐藏层解释深度学习中的隐藏层是干什么的?_叫我AC的博客-CSDN博客_隐藏层

    2. 人感知深度靠的是人眼的视差
    3. 与浅层学习区别
      1. 强调了模型结构的深度,通常有5-10多层的隐层节点
      2. 明确突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
  2. 人脑🧠工作原理
    1. 从原始信号(像素级信号)到进一步信号处理,得到一些信息的边缘特征,然后进行抽象判断物体的形状,最后进一步抽象,得到物体的模型

    2. 高层特征是低层特征的组合,从低层到高层的特征它越来越抽象,越来越能表现语义,从而有利于目标的识别以及分类

      人脑工作原理
  3. 深度学习 🆚 神经网络

    1. 相同点
      二者均采用分层结构,系统包括输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个logistic回归模型。

    2. 不同点:算法不同

      1. 神经网络:采用BP算法调整参数,即采用迭代算法来训练整个网络。随机设定初值,计算当前网络的输出,然后根据当前输出和样本真实标签之间的差去改变前面各层的参数,直到收敛

      2. 深度学习:采用逐层训练机制。采用该机制的原因在于如果采用BP机制,对于1个deep network (7层以上),残差传播到最前面的层将变得很小,出现所谓gradient diffusion (梯度扩散)。

 


 若笔记📒存在记录错误,请批评指正!

学习视频来源⬇️

数字媒体技术概论_中国传媒大学_中国大学MOOC(慕课)数字媒体技术概论,spContent=以数字媒体、网络技术与计算机技术相融合而产生的数字媒体技术,已经成为最热门的研究领域之一。如果你想了解数字媒体技术的奥妙,并想从事数字媒体技术相关的工作,请加入我们吧!让我们一起共同领略数字媒体技术的魅力,打下坚实的数字媒体技术基础。,中国大学MOOC(慕课)https://www.icourse163.org/course/CUC-1206705818?tid=1460872446

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐