HR部门的Agent版图:招聘、入职到员工体验
在开始正式的定义之前,我们先来看一个字节跳动2023年小范围验证的「招聘前岗位需求分析与JD自动生成场景」的真实案例——这个案例非常直观地展示了HR AI工具和HR AI Agent的区别。通过上面的真实案例对比,我们可以清晰地看到HR AI工具和HR AI Agent的本质差异对比维度HR AI工具核心功能帮你「做某一件事」——比如自动生成JD的GPT插件、自动筛选简历的ATS系统、自动打电话的
HR部门的Agent版图:招聘、入职到员工体验
引言
背景介绍
各位读者好!我是资深软件工程师兼技术博主「代码诗人与职场观察者」。最近两周和几位大厂HR总监、AI SaaS产品经理以及某垂直领域开源Agent框架的贡献者喝了咖啡——咖啡很苦,但聊到的AI Agent在人力资源全链路的落地却让人眼前一亮,甚至有点「后背发凉」的紧迫感:后背发凉是因为传统HR的很多标准化、重复性甚至需要「跨部门摸爬滚打才能凑齐信息」的工作,正在被能自主规划、调用工具、整合信息的AI Agent一点点「啃掉」;眼前一亮是因为这意味着HR从业者终于能从「事务性打杂」中彻底解放,去做真正有价值的「战略型伙伴」工作——比如组织文化建设、员工潜力挖掘、人才梯队规划等等。
根据Gartner 2024年最新发布的《HR技术成熟度曲线》,AI驱动的HR全链路协作Agent目前正处于「期望膨胀期的顶点之后的冷静期初期」,但这恰恰是落地最容易出成果的阶段——泡沫散去,留下来的都是有真实需求、有成熟技术支撑的项目。据我了解,字节跳动的「飞书People AI Assistant」、腾讯的「企业微信HR智能助手+内部知识库Agent」、美团的「HR招聘全流程Agent矩阵」,甚至是像脉脉这样的第三方招聘平台,都已经在2023-2024年间把Agent从demo阶段推进到了小范围核心业务验证→核心业务10%以上覆盖→全链路部分场景标准化部署的三重阶段,部分公司的Agent覆盖场景已经超过了15个,人均事务性工作时间减少了20%-40%,核心人才招聘周期缩短了15%-30%——这个效率提升数据,是任何传统的HR SaaS工具都很难做到的。
核心问题
可能有些读者会问:「现在市场上有那么多HR AI工具——比如自动生成JD的GPT插件、自动筛选简历的ATS系统、自动打电话的AI外呼机器人,这些不就是HR AI吗?为什么还要提Agent?Agent和这些工具到底有什么区别?」
没错,这正是我要在这篇文章里回答的第一个核心问题:HR AI工具 vs HR AI Agent的本质差异是什么?
其次,即使你已经理解了Agent的价值,你可能还会问:「HR全链路这么长——从招聘前的岗位需求分析,到招聘中的简历筛选、面试安排、面试辅助、Offer谈判,再到入职后的入职引导、培训、绩效管理、薪酬福利、员工关系、离职,最后是离职后的人才库维护——哪些场景适合用Agent?哪些场景不适合?」
这就是我要回答的第二个核心问题:构建完整的HR部门Agent版图的核心场景有哪些?每个场景的Agent架构、核心功能、技术栈是怎样的?
最后,作为软件工程师或企业管理者,你可能最关心的是:「如果我想在自己的公司或项目里落地一个HR Agent(哪怕是从最简单的场景开始),我应该怎么做?需要哪些技术?有哪些现成的工具和框架可以用?有哪些坑是需要避免的?」
这就是我要回答的第三个核心问题:HR Agent的落地路径、最佳实践和避坑指南是什么?
文章脉络
为了清晰、全面、深入浅出地回答这三个核心问题,我将这篇文章分成了以下几个部分:
-
HR AI工具 vs HR AI Agent:本质差异与核心定义
- 先通过一个真实的「字节跳动招聘前岗位需求分析场景」对比,展示工具和Agent的区别
- 再定义什么是「HR AI Agent」,并拆解HR AI Agent的三大核心要素:感知层、决策规划层、执行交互层
- 最后给出HR AI Agent的能力模型与能力等级划分(从L0到L4)
-
HR部门的完整Agent版图:从招聘前到离职后的3大阶段12个核心场景
- 第一阶段:招聘全链路Agent矩阵(5个核心场景,预计占全文30%)
- 场景1:招聘前——岗位需求分析与JD自动生成Agent
- 场景2:招聘中——简历智能筛选与初面邀约Agent
- 场景3:招聘中——AI辅助多轮面试与面试官培训Agent
- 场景4:招聘中——Offer谈判与Offer生成Agent
- 场景5:招聘后——面试反馈收集与人才库运营Agent
- 第二阶段:入职与员工体验全链路Agent矩阵(5个核心场景,预计占全文35%)
- 场景6:入职前——入职材料收集与入职引导个性化Agent
- 场景7:入职中——线上/线下入职全流程自动化协同Agent
- 场景8:入职后——新员工培训路径规划与学习陪伴Agent
- 场景9:日常运营——薪酬福利查询与员工自助服务Agent
- 场景10:组织协同——部门协作沟通与跨部门信息查询Agent
- 第三阶段:员工保留与离职全链路Agent矩阵(2个核心场景,预计占全文15%)
- 场景11:员工保留——离职风险预警与个性化关怀计划制定Agent
- 场景12:离职——离职流程自动化与离职人才关系维护Agent
- 版图补充:HR Agent的大脑——企业级HR知识库+人才图谱构建Agent
- 为什么需要这个「大脑」?
- 核心功能与技术栈
- 架构设计
- 第一阶段:招聘全链路Agent矩阵(5个核心场景,预计占全文30%)
-
HR Agent的落地路径、最佳实践与避坑指南(预计占全文15%)
- 落地路径三步走:从单点工具型Agent→单链路协作型Agent→全链路生态型Agent
- 最佳实践5条:
- 从高频、低风险、标准化程度高的场景切入(比如薪酬福利查询Agent)
- 必须构建企业级的统一知识库和人才图谱,否则Agent就是「瞎子」
- 必须设计好「人-Agent-工具-其他部门」的协作机制,明确Agent的权限边界
- 必须重视数据安全与隐私保护(HR数据是企业的核心资产,也是最敏感的数据之一)
- 必须建立持续的评估与迭代机制(用数据说话,不断优化Agent的表现)
- 避坑指南3个大坑:
- 坑1:不要一开始就做「全能型Agent」,要做「专精型Agent的组合体」
- 坑2:不要高估LLM的能力,要充分利用RAG、工具调用、规则引擎等技术来弥补LLM的不足
- 坑3:不要只关注技术,要关注HR从业者和员工的用户体验(用户不接受的技术,再先进也没用)
-
HR Agent的行业发展与未来趋势(预计占全文5%)
- 用markdown表格展示「HR Agent的问题演变发展历史」(从2010年之前的传统HR SaaS,到2010-2020年的HR AI工具,再到2020-2023年的单链路Agent,最后到2023年至今的全链路协作Agent)
- 未来3-5年的发展趋势预测:
- 趋势1:Agent会更加「拟人化」和「个性化」,能理解员工的情绪和需求
- 趋势2:Agent会和更多的非HR工具(比如飞书、钉钉、企业微信、项目管理工具、财务工具、CRM工具等)深度集成,形成真正的「企业级协同生态」
- 趋势3:Agent的能力会从「感知、决策规划、执行交互」的基础能力,升级到「战略规划辅助、人才潜力挖掘、组织文化诊断」的高级能力
- 趋势4:开源Agent框架(比如LangChain、AutoGPT、CrewAI、MetaGPT、Agents等)会越来越成熟,中小公司也能低成本落地HR Agent
- 趋势5:数据安全与隐私保护的法律法规会越来越严格,HR Agent的合规性会成为核心竞争力
-
总结与展望(预计占全文0.5%)
- 回顾文章的核心内容
- 展望未来,鼓励读者尝试在自己的公司或项目里落地HR Agent
1. HR AI工具 vs HR AI Agent:本质差异与核心定义
1.1 真实场景对比:工具帮你「做某一件事」,Agent帮你「完成整个任务」
在开始正式的定义之前,我们先来看一个字节跳动2023年小范围验证的「招聘前岗位需求分析与JD自动生成场景」的真实案例——这个案例非常直观地展示了HR AI工具和HR AI Agent的区别。
1.1.1 传统HR+HR AI工具的工作流程(耗时:2-3天)
假设字节跳动的某个抖音电商业务线的产品经理(需求方)需要招聘一名「抖音电商直播数据分析高级产品经理」,传统的工作流程是这样的:
- 需求方提交岗位需求初稿(耗时:1小时):产品经理在飞书People的「岗位需求提交」系统里填写了一堆非常模糊的信息——比如「负责抖音电商直播数据分析产品的设计和迭代」、「需要3年以上的电商数据分析产品经验」、「需要熟悉抖音直播生态」、「薪资面议」等等。
- HRBP(业务伙伴型HR)审核并细化需求(耗时:4-6小时):
- 第一步:HRBP需要先和产品经理(以及产品总监、业务线总监)开1-2次会,了解业务线的具体情况——比如最近的业务目标是什么?为什么要招聘这个岗位?这个岗位的KPI是什么?需要和哪些部门协作?(需要提前预约会议时间,有时候业务方没时间,会议要拖1-2天)
- 第二步:HRBP需要去飞书知识库查一下「抖音电商直播数据分析高级产品经理」这个岗位的历史JD——看看之前有没有招过类似的岗位,之前的JD是怎么写的,之前的薪资范围是多少,之前的面试标准是什么?(有时候历史JD找不到,或者历史JD已经过时了,需要重新整理)
- 第三步:HRBP需要去内部人才库查一下有没有合适的人选——看看有没有之前面试过但没入职的,或者有没有内部员工想转岗的?(有时候内部人才库的信息更新不及时,或者搜索功能不好用,需要手动筛选)
- 第四步:HRBP需要去外部招聘平台(比如脉脉、BOSS直聘、猎聘)查一下「抖音电商直播数据分析高级产品经理」这个岗位的市场情况——看看市场上有多少这样的候选人,候选人的平均薪资是多少,候选人的核心技能要求是什么?(需要切换多个平台,手动收集信息,然后整理成Excel表格,耗时非常长)
- 第五步:HRBP根据收集到的所有信息,把需求方提交的模糊需求细化成一份详细的「岗位需求说明书」——包括岗位名称、所属部门、汇报对象、下属人数、业务目标、岗位职责、任职要求(必备技能、加分技能)、薪资范围、面试流程、入职时间等等。
- 业务线总监、HR总监审批岗位需求说明书(耗时:1-2天):HRBP把「岗位需求说明书」发给业务线总监和HR总监审批——有时候总监们会提出修改意见,需要反复修改几次。
- HR招聘专员生成正式的JD并发布到招聘平台(耗时:1-2小时):审批通过后,HR招聘专员把「岗位需求说明书」转换成正式的JD——需要注意JD的措辞(要吸引候选人,不能太生硬),需要加上公司的介绍、业务线的介绍、福利待遇的介绍等等——然后用GPT插件生成几个不同版本的JD,选一个最好的,发布到内部人才库和外部招聘平台(比如脉脉、BOSS直聘、猎聘)。
整个流程下来,耗时大概是2-3天——而且大部分时间都花在了「跨部门沟通」、「手动收集和整理信息」、「反复修改」这些重复性、低价值的工作上。
1.1.2 传统HR+HR AI Agent的工作流程(耗时:20-30分钟)
现在,我们来看一下用HR AI Agent(我们暂时给它起个名字叫「飞书People HR招聘需求Agent」)之后的工作流程:
- 需求方和Agent进行自然语言对话提交需求(耗时:5-10分钟):产品经理不需要再去填一堆复杂的表单,只需要打开飞书People,找到「飞书People HR招聘需求Agent」,然后用自然语言和它对话——比如:
产品经理:你好,我是抖音电商直播业务线的产品经理张三,我需要招聘一名「抖音电商直播数据分析高级产品经理」。
Agent:你好张三!很高兴为您服务。为了帮您生成一份详细、准确、符合市场需求的岗位需求说明书和JD,我需要向您确认几个问题,请您配合回答一下好吗?
产品经理:好的,你问吧。
Agent:第一个问题:您最近的业务目标是什么?为什么要招聘这个岗位?是因为业务扩张、现有员工离职,还是因为新业务启动?
产品经理:我们最近的业务目标是「把抖音电商直播的GMV从每月100亿提升到每月150亿」——要实现这个目标,我们需要更精准的直播数据分析产品,帮助主播和商家优化直播内容、选品策略、流量投放策略等等。现在我们的直播数据分析产品只能提供基础的数据报表,不能提供个性化的洞察和建议,所以我们需要招聘一名高级产品经理来负责这个产品的设计和迭代。
Agent:好的,我已经记录下来了。第二个问题:这个岗位的KPI是什么?需要和哪些部门协作?汇报对象是谁?有没有下属?
产品经理:这个岗位的KPI主要有三个:第一,「直播数据分析产品的DAU/MAU提升30%以上」;第二,「主播和商家对直播数据分析产品的满意度提升到4.5分以上(满分5分)」;第三,「帮助至少1000个头部主播和商家把GMV提升10%以上」。需要协作的部门主要有:抖音电商直播运营部、抖音电商技术部、抖音电商数据部、抖音电商商业化部。汇报对象是抖音电商直播业务线的产品总监李四。暂时没有下属,但如果业务发展得好,可能会招1-2名产品助理。
Agent:好的,我已经记录下来了。第三个问题:您对候选人的核心技能要求是什么?必备技能和加分技能分别是什么?有没有学历和工作经验的要求?
产品经理:必备技能主要有四个:第一,「3年以上的电商数据分析产品经验,最好是直播电商数据分析产品经验」;第二,「熟悉抖音直播生态,了解主播和商家的需求」;第三,「熟练使用SQL、Python等数据分析工具,能独立完成数据清洗、数据分析、数据可视化等工作」;第四,「有很强的产品思维和逻辑思维,能从海量的数据中挖掘出有价值的洞察和建议」。加分技能主要有三个:第一,「有在字节跳动、阿里巴巴、京东、快手等大型互联网公司工作的经验」;第二,「有机器学习或深度学习的基础,能和算法团队协作开发个性化的推荐模型」;第三,「有很强的沟通能力和协调能力,能和多个部门高效协作」。学历要求是本科及以上,最好是计算机科学、统计学、数学、经济学等相关专业。工作经验要求是3-5年,特别优秀的可以放宽到2年。
Agent:好的,我已经记录下来了。第四个问题:您对候选人的薪资范围有什么要求吗?有没有入职时间的要求?
产品经理:薪资范围暂时定在「月薪30k-50k,14薪+年终奖+股票期权」——具体薪资可以根据候选人的经验和能力面议。入职时间最好是在1个月以内,最晚不超过2个月。
Agent:好的,我已经把所有的信息都记录下来了。现在我需要一点时间(大概5-10分钟)来帮您生成一份详细的「岗位需求说明书」和三个不同版本的正式JD——在生成之前,我会先做以下几件事:第一,调用内部知识库工具,查询一下「抖音电商直播数据分析高级产品经理」这个岗位的历史JD和面试标准;第二,调用内部人才库工具,搜索一下有没有合适的内部转岗或外部待入职候选人;第三,调用外部招聘平台工具(通过API),查询一下这个岗位的市场情况——比如市场上的候选人数量、平均薪资、核心技能要求、热门公司等等;第四,调用RAG工具,查询一下最近3个月关于「抖音电商直播数据分析」的行业报告和新闻;第五,根据收集到的所有信息,结合您刚才的回答,生成一份符合要求的「岗位需求说明书」和三个不同版本的JD——一个是「专业严谨版」(用于内部审批),一个是「活泼吸引版」(用于发布到外部招聘平台),一个是「简洁版」(用于发布到内部人才库)。您觉得可以吗?
产品经理:好的,没问题!你快去生成吧,辛苦了! - Agent自主执行任务并生成结果(耗时:5-10分钟):Agent收到产品经理的确认后,就开始自主规划任务、调用工具、整合信息——不需要任何人工干预,只需要5-10分钟就能完成。
- Agent把结果推送给需求方、HRBP、业务线总监、HR总监(耗时:1分钟):Agent完成任务后,会把「岗位需求说明书」、三个不同版本的JD、「内部人才库搜索结果」、「外部市场情况分析报告」这四份文件推送给相关人员——并且会在飞书People的消息栏里@所有人,提醒他们查看。
- 相关人员审核并修改结果(如果需要的话)(耗时:5-10分钟):相关人员收到结果后,可以在线查看和修改——如果有修改意见,Agent会根据修改意见自动调整「岗位需求说明书」和JD,不需要人工重新生成。
- 审批通过后,Agent自动把JD发布到内部人才库和外部招聘平台(耗时:1分钟):如果所有人都审批通过了,Agent会自动把「简洁版」JD发布到内部人才库,把「活泼吸引版」JD发布到外部招聘平台(比如脉脉、BOSS直聘、猎聘)——并且会自动设置好「岗位有效期」、「简历接收邮箱」、「面试安排权限」等等。
整个流程下来,耗时大概是20-30分钟——是传统流程的1/10到1/20!而且所有的「跨部门沟通」、「手动收集和整理信息」、「反复修改」这些重复性、低价值的工作都由Agent完成了,需求方、HRBP、业务线总监、HR总监只需要做「确认需求」、「审核结果」、「提出修改意见」这些高价值的工作。
1.1.3 对比总结:工具和Agent的本质差异
通过上面的真实案例对比,我们可以清晰地看到HR AI工具和HR AI Agent的本质差异:
| 对比维度 | HR AI工具 | HR AI Agent |
|---|---|---|
| 核心功能 | 帮你「做某一件事」——比如自动生成JD的GPT插件、自动筛选简历的ATS系统、自动打电话的AI外呼机器人 | 帮你「完成整个任务」——比如从「需求方提交模糊需求」到「生成正式JD并发布到招聘平台」的整个流程 |
| 自主性 | 没有自主性——必须由人类发起和控制每一个步骤,人类不说「开始」,工具就不会动 | 有自主性——可以自主规划任务、自主调用工具、自主整合信息、自主完成整个流程,只需要人类在「关键节点」(比如确认需求、审批结果)进行干预 |
| 工具调用能力 | 没有工具调用能力(或者只能调用自己内部的工具)——比如自动生成JD的GPT插件只能生成文本,不能去查内部知识库、不能去查外部市场情况、不能去发布JD | 有强大的工具调用能力——可以调用内部工具(比如飞书People、内部知识库、内部人才库)、可以调用外部工具(比如脉脉、BOSS直聘、猎聘的API、天气API、地图API)、可以调用RAG工具、可以调用规则引擎、可以调用其他Agent |
| 记忆能力 | 没有(或者只有短期的)记忆能力——比如你第一次用自动生成JD的GPT插件生成了一个JD,第二次再用的时候,它根本不记得你之前生成过什么 | 有长期的记忆能力——可以记住和每个用户的对话历史、可以记住每个任务的执行历史、可以记住每个候选人的信息、可以记住每个岗位的信息 |
| 协作能力 | 没有协作能力——不能和人类协作,不能和其他工具协作,不能和其他Agent协作 | 有强大的协作能力——可以和人类协作(比如需要人类确认需求、审批结果)、可以和其他工具协作(比如需要调用内部知识库、外部招聘平台)、可以和其他Agent协作(比如招聘需求Agent可以和简历筛选Agent、面试安排Agent协作,形成一个招聘全链路Agent矩阵) |
| 价值创造 | 只能提高「某一件事」的效率——比如自动生成JD的GPT插件可以把生成JD的时间从1小时缩短到10分钟 | 可以提高「整个任务」的效率,甚至可以创造新的价值——比如招聘需求Agent可以把整个招聘前流程的时间从2-3天缩短到20-30分钟,而且可以生成更准确、更符合市场需求的JD,提高招聘成功率 |
1.2 核心定义:什么是HR AI Agent?
看完上面的对比,相信大家对HR AI Agent已经有了一个初步的印象——现在我们来给HR AI Agent下一个正式的定义:
HR AI Agent(人力资源智能体) 是一种基于大语言模型(LLM)或多模态大模型(MLLM),具备感知层、决策规划层、执行交互层三大核心要素,能自主感知用户需求、自主规划任务路径、自主调用内部/外部工具、自主整合多源信息、自主完成HR全链路相关任务、能和人类、其他工具、其他Agent进行高效协作、有长期记忆能力、能持续学习和迭代的智能实体。
这个定义有点长,我们来逐一拆解一下:
1.2.1 核心技术基础:基于大语言模型(LLM)或多模态大模型(MLLM)
HR AI Agent的核心技术基础是大语言模型(LLM)——比如GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro、Qwen 2.5 Max、Llama 3.1 405B等等。LLM的核心能力是「理解自然语言」、「生成自然语言」、「逻辑推理」、「知识应用」——这些能力是HR AI Agent能和用户进行自然语言对话、能自主规划任务路径、能整合多源信息的基础。
未来,随着**多模态大模型(MLLM)**的发展(比如GPT-4o、Claude 3.5 Opus、Gemini 1.5 Pro都已经支持多模态了),HR AI Agent的能力会进一步提升——比如可以理解候选人的视频简历、可以理解面试官的表情和语气、可以生成新员工的培训视频、可以理解员工的手写请假条等等。
1.2.2 三大核心要素:感知层、决策规划层、执行交互层
这三大核心要素是HR AI Agent的「骨架」——没有这三大核心要素,HR AI Agent就只是一个普通的LLM聊天机器人,不是真正的Agent。我们会在1.3节详细讲解这三大核心要素。
1.2.3 五大核心能力:
- 自主感知能力:能自主感知用户的需求(比如通过自然语言对话、通过邮件、通过飞书/钉钉/企业微信的消息、通过系统的日志等)、能自主感知环境的变化(比如内部知识库的更新、外部市场情况的变化、员工的离职风险预警等)。
- 自主规划任务路径能力:能根据用户的需求和环境的变化,自主规划出最优的任务路径(比如先做什么、再做什么、需要调用哪些工具、需要整合哪些信息等)。
- 自主调用工具能力:能自主调用内部工具(比如飞书People、内部知识库、内部人才库、财务系统、项目管理系统等)、能自主调用外部工具(比如脉脉、BOSS直聘、猎聘的API、天气API、地图API、行业报告API等)、能自主调用RAG工具、能自主调用规则引擎、能自主调用其他Agent。
- 自主整合多源信息能力:能自主整合来自内部工具、外部工具、RAG工具、用户对话、任务执行历史等多源的信息,形成一个完整的、准确的、有价值的信息库。
- 自主完成HR全链路相关任务能力:能自主完成从招聘前到离职后的HR全链路相关任务——比如岗位需求分析、JD自动生成、简历筛选、面试安排、面试辅助、Offer谈判、入职引导、培训、绩效管理、薪酬福利、员工关系、离职、人才库运营等等。
1.2.4 三大协作能力:
- 和人类协作能力:能和需求方、HRBP、业务线总监、HR总监、面试官、候选人、员工等人类进行高效协作——比如需要人类确认需求、审批结果、提供补充信息、做出关键决策等。
- 和其他工具协作能力:能和飞书、钉钉、企业微信、项目管理工具、财务工具、CRM工具等非HR工具进行深度集成和高效协作。
- 和其他Agent协作能力:能和其他HR AI Agent进行高效协作——比如招聘需求Agent可以和简历筛选Agent、面试安排Agent、Offer谈判Agent协作,形成一个招聘全链路Agent矩阵;入职引导Agent可以和新员工培训Agent、薪酬福利查询Agent协作,形成一个入职与员工体验全链路Agent矩阵。
1.2.5 长期记忆能力与持续学习迭代能力:
- 长期记忆能力:可以记住和每个用户的对话历史、可以记住每个任务的执行历史、可以记住每个候选人的信息、可以记住每个岗位的信息、可以记住每个员工的信息、可以记住每个部门的信息、可以记住公司的组织架构、可以记住公司的规章制度等等——这些记忆可以帮助Agent更好地理解用户的需求、更好地完成任务、更好地和用户进行个性化的对话。
- 持续学习迭代能力:可以通过用户的反馈、通过任务执行的结果、通过内部知识库的更新、通过外部环境的变化等,持续学习和迭代自己的能力——比如可以学习新的行业知识、可以学习新的公司规章制度、可以优化自己的任务规划路径、可以优化自己的工具调用策略、可以优化自己的对话风格等等。
1.3 HR AI Agent的三大核心要素详解
刚才我们在定义里提到了HR AI Agent的三大核心要素:感知层、决策规划层、执行交互层——现在我们来详细讲解这三大核心要素,并且用一个**「员工自助查询薪资福利Agent」**的例子来说明每个层的作用。
1.3.1 感知层:HR AI Agent的「眼睛、耳朵和鼻子」
感知层是HR AI Agent的「输入层」——它的作用是感知和收集来自外部世界和内部系统的各种信息,并把这些信息转换成Agent能理解的格式(比如文本、图像、音频、视频、结构化数据等)。
感知层的核心组件包括:
- 自然语言处理(NLP)组件:负责理解和生成自然语言——比如理解用户的对话、理解用户的邮件、理解用户的飞书/钉钉/企业微信消息、生成Agent的回复、生成邮件、生成飞书/钉钉/企业微信消息等。
- 核心技术:文本分词、词性标注、命名实体识别(NER)、意图识别、文本分类、情感分析、机器翻译、文本摘要、文本生成等。
- 多模态处理(MMP)组件:负责理解和生成多模态信息——比如理解候选人的视频简历、理解面试官的表情和语气、生成新员工的培训视频、理解员工的手写请假条、生成员工的薪酬福利可视化图表等。
- 核心技术:计算机视觉(CV)、语音识别(ASR)、语音合成(TTS)、图像生成、视频生成、音频生成等。
- 结构化数据处理组件:负责理解和处理结构化数据——比如从内部HR系统(飞书People、SAP SuccessFactors、Workday等)里读取员工的薪资福利信息、从内部人才库里读取候选人的信息、从外部招聘平台的API里读取市场情况信息、把Agent生成的结果写入内部HR系统等。
- 核心技术:API集成、数据库查询(SQL、NoSQL)、数据清洗、数据转换、数据可视化等。
- 环境感知组件:负责感知环境的变化——比如内部知识库的更新、外部市场情况的变化、员工的离职风险预警、系统的故障预警等。
- 核心技术:日志分析、事件监听、数据监控、异常检测等。
「员工自助查询薪资福利Agent」的感知层例子
假设员工王五想查询自己「2024年9月份的薪资福利明细」,并且想知道「自己的公积金缴纳基数是怎么算的」——感知层的工作流程是这样的:
- 自然语言处理(NLP)组件:王五打开飞书People,找到「员工自助查询薪资福利Agent」,然后用自然语言和它对话:「你好,我是王五,工号是123456,我想查询一下2024年9月份的薪资福利明细,另外我还想知道我的公积金缴纳基数是怎么算的。」——NLP组件会对这段对话进行文本分词、词性标注、命名实体识别(NER)、意图识别、情感分析:
- 命名实体识别(NER):识别出「王五」是员工姓名,「123456」是员工工号,「2024年9月份」是时间,「薪资福利明细」是查询对象1,「公积金缴纳基数的计算方法」是查询对象2。
- 意图识别:识别出用户的两个意图:「查询薪资福利明细」和「查询公积金缴纳基数的计算方法」。
- 情感分析:识别出用户的情感是「中性」的,没有不满或投诉。
- 结构化数据处理组件:NLP组件把识别出的「员工工号123456」、「时间2024年9月份」、「查询对象1薪资福利明细」这些信息传给结构化数据处理组件——结构化数据处理组件会调用内部HR系统(飞书People)的API,验证员工工号的有效性,然后查询员工王五2024年9月份的薪资福利明细(包括基本工资、绩效工资、奖金、补贴、五险一金、个人所得税、实发工资等),并把这些结构化数据转换成Agent能理解的格式。
- 环境感知组件:同时,环境感知组件会监听内部知识库的更新情况——如果内部知识库最近更新了「公积金缴纳基数的计算方法」,就会通知决策规划层。
1.3.2 决策规划层:HR AI Agent的「大脑和心脏」
决策规划层是HR AI Agent的「核心层」——它的作用是根据感知层收集到的信息,结合Agent的长期记忆、内部知识库、规则引擎,自主规划出最优的任务路径,做出关键决策。
决策规划层的核心组件包括:
- 长期记忆组件:负责存储和管理Agent的长期记忆——比如和每个用户的对话历史、每个任务的执行历史、每个候选人的信息、每个岗位的信息、每个员工的信息、每个部门的信息、公司的组织架构、公司的规章制度等。
- 核心技术:向量数据库(Vector DB)——比如Pinecone、Weaviate、Chroma、Milvus、Qdrant等。向量数据库可以把文本、图像、音频、视频等非结构化数据转换成向量(Embedding),然后通过相似度搜索快速找到相关的记忆。
- 内部知识库组件(RAG):负责存储和管理企业的内部知识库——比如公司的规章制度、员工手册、薪酬福利政策、培训资料、历史JD、面试标准、行业报告等。
- 核心技术:检索增强生成(RAG)——RAG的核心思想是「在LLM生成回复之前,先从内部知识库中检索出相关的信息,然后把这些信息和用户的问题一起传给LLM,让LLM根据这些信息生成准确、可靠、符合企业要求的回复」——这样可以避免LLM「 hallucination(幻觉)」的问题(也就是LLM会编造一些不存在的信息)。
- RAG的工作流程:文档切分→文档向量化→向量存储→问题向量化→相似度搜索→检索相关文档→把相关文档和问题一起传给LLM→LLM生成回复。
- 规则引擎组件:负责存储和管理企业的业务规则——比如「员工的公积金缴纳基数是上一年度的月平均工资」、「试用期员工的薪资是正式员工的80%」、「年假天数根据员工的工龄计算:工龄不满1年的,年假5天;工龄满1年不满10年的,年假10天;工龄满10年不满20年的,年假15天;工龄满20年的,年假20天」等。
- 核心技术:规则引擎——比如Drools、Easy Rules、JsonLogic、LangChain的Rules Module等。规则引擎可以把业务规则从代码中分离出来,让业务人员可以直接修改业务规则,不需要开发人员重新编写代码——这样可以大大提高Agent的灵活性和可维护性。
- 任务规划组件:负责根据感知层收集到的信息、长期记忆、内部知识库、规则引擎,自主规划出最优的任务路径——比如先做什么、再做什么、需要调用哪些工具、需要整合哪些信息等。
- 核心技术:思维链(Chain of Thought, CoT)、思维树(Tree of Thought, ToT)、思维图(Graph of Thought, GoT)、LangChain的Chains和Agents、AutoGPT的任务分解、CrewAI的团队协作等。
- 决策组件:负责做出关键决策——比如「是否需要用户确认信息」、「是否需要调用额外的工具」、「是否需要把任务推送给其他Agent」、「是否需要生成警告或通知」等。
- 核心技术:LLM的逻辑推理能力、强化学习(RL)、基于规则的决策等。
「员工自助查询薪资福利Agent」的决策规划层例子
接上面的感知层例子,感知层已经收集到了以下信息:
- 用户的姓名:王五
- 用户的工号:123456
- 用户的意图1:查询2024年9月份的薪资福利明细
- 用户的意图2:查询公积金缴纳基数的计算方法
- 员工工号123456有效
- 内部HR系统已经返回了王五2024年9月份的薪资福利明细
- 内部知识库最近更新了「公积金缴纳基数的计算方法」
- 用户的情感是「中性」的
现在,决策规划层的工作流程是这样的:
- 长期记忆组件:首先,任务规划组件会调用长期记忆组件,搜索和员工王五的对话历史——看看王五之前有没有查询过类似的问题,如果有的话,可以参考之前的回复,提高回复的个性化程度。
- 内部知识库组件(RAG):然后,任务规划组件会调用内部知识库组件(RAG),检索和「公积金缴纳基数的计算方法」相关的文档——内部知识库最近更新了相关文档,所以可以快速找到准确、可靠的信息。
- 规则引擎组件:接着,任务规划组件会调用规则引擎组件,验证内部HR系统返回的王五2024年9月份的薪资福利明细是否符合企业的业务规则——比如验证「五险一金的缴纳比例是否正确」、「个人所得税的计算是否正确」、「实发工资的计算是否正确」等。
- 任务规划组件:然后,任务规划组件会根据以上信息,自主规划出最优的任务路径:
- 任务路径1:先把员工王五2024年9月份的薪资福利明细整理成一个清晰、易懂的表格(或者可视化图表)。
- 任务路径2:再把内部知识库检索到的「公积金缴纳基数的计算方法」整理成一段清晰、易懂的文字,并且结合王五的实际情况(比如上一年度的月平均工资),给出一个具体的例子。
- 任务路径3:最后,把整理好的薪资福利明细表格和公积金缴纳基数的计算方法一起传给执行交互层,让执行交互层生成自然语言回复,并且询问用户是否还有其他问题。
- 决策组件:最后,决策组件会做出关键决策:
- 决策1:不需要用户确认信息——因为员工工号已经验证有效,内部HR系统已经返回了准确的信息,内部知识库已经检索到了准确的信息。
- 决策2:不需要调用额外的工具——因为已经收集到了所有需要的信息。
- 决策3:不需要把任务推送给其他Agent——因为这是一个简单的自助查询任务,不需要其他Agent的协作。
- 决策4:不需要生成警告或通知——因为用户的情感是「中性」的,薪资福利明细符合业务规则。
1.3.3 执行交互层:HR AI Agent的「手和嘴」
执行交互层是HR AI Agent的「输出层」——它的作用是根据决策规划层规划的任务路径,调用相应的工具,执行相应的任务,然后和用户、其他工具、其他Agent进行交互。
执行交互层的核心组件包括:
- 工具调用组件:负责调用内部工具、外部工具、RAG工具、规则引擎、其他Agent——比如调用内部HR系统的API查询员工的薪资福利明细、调用外部天气API查询天气、调用RAG工具检索内部知识库、调用规则引擎验证业务规则、调用其他Agent协助完成任务等。
- 核心技术:LLM的工具调用能力(Function Calling)、LangChain的Tools、AutoGPT的Plugins、CrewAI的Tools等。
- 任务执行组件:负责执行具体的任务——比如整理数据、生成图表、生成文档、发送邮件、发送飞书/钉钉/企业微信消息、更新内部HR系统、发布JD到外部招聘平台等。
- 核心技术:LLM的文本生成能力、数据可视化工具(比如Matplotlib、Plotly、ECharts)、文档生成工具(比如Python-docx、Pandoc)、邮件发送工具(比如SMTP、SendGrid)、飞书/钉钉/企业微信的API等。
- 交互组件:负责和用户、其他工具、其他Agent进行交互——比如和用户进行自然语言对话、和用户进行多模态对话(比如语音对话、视频对话)、接收用户的反馈、向用户发送通知、和其他工具进行API交互、和其他Agent进行协作交互等。
- 核心技术:LLM的自然语言生成能力、语音合成(TTS)、语音识别(ASR)、计算机视觉(CV)、飞书/钉钉/企业微信的聊天机器人API、Webhook等。
「员工自助查询薪资福利Agent」的执行交互层例子
接上面的决策规划层例子,决策规划层已经规划好了任务路径,做出了关键决策——现在,执行交互层的工作流程是这样的:
- 工具调用组件:首先,工具调用组件会调用数据可视化工具(比如Plotly),把内部HR系统返回的王五2024年9月份的薪资福利明细整理成一个清晰、易懂的柱状图(或者饼图)。
- 任务执行组件:然后,任务执行组件会调用LLM的文本生成能力,把整理好的薪资福利明细表格、柱状图、内部知识库检索到的「公积金缴纳基数的计算方法」、结合王五实际情况的例子,一起整理成一段清晰、易懂、个性化的自然语言文本。
- 交互组件:最后,交互组件会调用飞书People的聊天机器人API,把整理好的自然语言文本、薪资福利明细表格、柱状图一起发送给员工王五,并且询问用户是否还有其他问题——比如:
员工自助查询薪资福利Agent:你好王五!这是你2024年9月份的薪资福利明细:
[插入薪资福利明细表格]
[插入薪资福利明细柱状图]另外,你问的公积金缴纳基数的计算方法是这样的:根据公司的《薪酬福利政策》,员工的公积金缴纳基数是上一年度(自然年)的月平均工资——月平均工资的计算范围包括:基本工资、绩效工资、奖金、补贴(不包括加班费、临时福利等)。
结合你的实际情况:你2023年度的月平均工资是25000元,所以你2024年度的公积金缴纳基数是25000元——公司和个人的缴纳比例都是12%,所以你每个月的公积金缴纳金额是25000×12%×2=6000元(公司和个人各3000元)。
请问你还有其他问题吗?比如查询年假天数、查询社保缴纳明细、查询加班费计算方法等?
1.4 HR AI Agent的能力模型与能力等级划分
为了更清晰地描述HR AI Agent的能力,我们可以参考自动驾驶的能力等级划分(L0到L5),把HR AI Agent的能力也划分为5个等级(L0到L4)——为什么没有L5呢?因为HR是一个「以人为本」的工作,很多涉及到「情感、伦理、道德、战略决策」的工作,永远都需要人类来做,所以我们认为HR AI Agent永远都不可能达到「完全自动化,不需要任何人类干预」的L5等级。
1.4.1 HR AI Agent的能力模型
在划分能力等级之前,我们先来看一下HR AI Agent的能力模型——这个能力模型包括6个维度:
- 自然语言理解与生成能力:理解和生成自然语言的能力——比如理解用户的对话、理解用户的邮件、生成Agent的回复、生成邮件、生成JD等。
- 多模态理解与生成能力:理解和生成多模态信息的能力——比如理解候选人的视频简历、理解面试官的表情和语气、生成新员工的培训视频、生成员工的薪酬福利可视化图表等。
- 感知与环境适应能力:感知用户需求和环境变化的能力——比如通过自然语言对话感知用户需求、通过内部知识库的更新感知环境变化等。
- 决策规划与任务执行能力:自主规划任务路径、做出关键决策、执行具体任务的能力——比如规划招聘前流程的任务路径、做出是否需要用户确认的决策、执行发布JD的任务等。
- 工具调用与协作能力:自主调用工具、和人类/其他工具/其他Agent进行高效协作的能力——比如调用内部HR系统的API、和用户进行协作、和其他Agent进行协作等。
- 长期记忆与持续学习迭代能力:存储和管理长期记忆、持续学习和迭代自己能力的能力——比如记住和每个用户的对话历史、通过用户的反馈持续学习等。
1.4.2 HR AI Agent的能力等级划分(L0到L4)
现在,我们根据上面的6个能力维度,把HR AI Agent的能力划分为5个等级(L0到L4):
| 能力等级 | 名称 | 自然语言理解与生成能力 | 多模态理解与生成能力 | 感知与环境适应能力 | 决策规划与任务执行能力 | 工具调用与协作能力 | 长期记忆与持续学习迭代能力 | 典型场景 | 典型代表 |
|---|---|---|---|---|---|---|---|---|---|
| L0 | 传统HR SaaS工具 | 无(或只有简单的关键词匹配) | 无 | 无 | 无(只能执行人类预先设定好的、固定的任务) | 无(或只能调用自己 |
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐

所有评论(0)