李宏毅机器学习笔记43

本篇文章继续学习李宏毅老师2025春季机器学习课程，学习内容是meta learning的基本概念和基本的训练过程。

koo364

985人浏览 · 2025-11-08 22:25:41

koo364 · 2025-11-08 22:25:41 发布

摘要

1.meta learning

摘要

本篇文章继续学习李宏毅老师2025春季机器学习课程，学习内容是meta learning的基本概念和基本的训练过程

1.meta learning

meta learning就是学习如何学习，首先复习一下machine learning，machine learning就是要找一个function，例如影像辨识，输入一张图片，输出是“猫”。一共三个步骤，第一是定义一个function，function有一些位置的参数。

第二部是要定义一个loss function，它代表function的好坏。

第三步，就是要找参数，这些参数使得loss function的值越小越好，常用gradient descent。

学习这件事，本身也是一个function，称为learning algorithm，假设训练的是一个classifier，把训练资料作为输入，输入函数F，输出一个classifier。那么如何用与机器学习相同三个步骤去找这个函数F，就是meta learning。

第一个步骤，在learning algorithm找到需要学习的东西（参数），称为，这些参数就是我们希望机器自己决定的东西。

第二步，就是要定义loss function，记作，L一般来自于训练资料，在meta learning中收集的是训练的任务，假设想要训练一个二元分类器，就要准备很多二元分类的任务。

有了任务之后，判断F好不好的依据是，把任务拿出来给F学习看看得到classifier f1，如果f1是好的就代表F是好的，L就低。

如何判断f1好不好？就把f1跑在测试资料上，将结果与正确答案比较得到l1，l1代表f1的表现如何。l1的计算方法与机器学习很像，输入测试资料到f1，得到输出，计算输出与正确答案的corss entropy，把corss entropy都加起来即为l1。l越小代表f越好，就意味着F越好。

meta learning有很多的任务，所以不会只看一个任务，假设第二个二元分类器以同样的方式计算为l2，那么L就是l1+l2，即为所有任务的l的总和。

第三步，找一个让L越小越好。如果是可以计算的，那么可以直接使用gradient descent的方法去寻找；如果是不可计算的，就用reinforce learning训练下去就能找到。

整个meta learning的架构如下图，通过训练资料的任务得出了一个F，用测试资料的任务测试F是否能得出一个想要的classifier。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

老板要的不是聊天机器人：一篇讲明白企业级 Agent 怎么搭

这篇文章用大白话讲清楚企业级 Agent 是什么、需要哪些工具、正确的落地路线是什么，并用报销审核案例说明 Agent 为什么不是聊天机器人。

DAMO开发者矩阵

从场景落地到技术迭代：服务机器人迈入规模化商用爆发期

采用8nm工艺，搭载6TOPS NPU算力，支持8K编解码、多传感器融合、高精度力控、复杂环境自主导航、机械臂动态运动规划，算力性能强劲、体积小巧、功耗可控，可支撑人形康养机器人、高端AI理疗机器人、工业级AMR、四足巡检机器人等高负载、高智能需求的高端设备开发。商用服务机器人主要应用于酒店、商场、写字楼、园区等公共场景，可实现迎宾引路、物品配送、清洁消杀、导购讲解、安防巡逻等标准化重复作业，核心