本文最早发表在知乎。原问题是:“deepseek在我没有点亮联网搜索的时候,它自己显示出联网搜索了,如何解释,或者说意味着什么?”。

这跟产品设计理念有关,也跟现在国内各模型大厂的风格有关,都是先把功能推出,好不好再说,一边搜集用户反馈一边做优化。

豆包也是一样的,它底部都没有让你选择是不是联网的按钮。它也会在思考过程中主动调用搜索工具。

我是poe.com用户,从去年下半年开始用它。我介绍下poe这个平台对工具调用的处理方式,可能大家就更好理解了。

首先,跟国内这些平台最大的不同是,poe.com上面能集成了很多主流的大模型,所以,工具调用的稳定性,去年10月份的时候,如果用的是当时Claude3.5这种水平的模型,已经可以做得相当不错了。

那个时候MCP这个概念还没有出来,“工具调用”只停留在业内人士的认知里,认为会是很有潜力的方向。

有意思的是,在poe上面,其实他们一直一点点地给模型加工具调用的能力,但是悄悄进行,并没有说加了一个能力,就要广而告之。这就导致,很多用户根本不知道,他们除了可以跟机器人聊天,其实还可以让机器人写代码,画画,做一些简单的设计,或者写个马上能玩的小游戏……

比如我在上面创建过一个叫Maxchef的大厨角色,有一次我说,如果你在推荐菜谱的时候能图文并茂地画出来就好了,它就激动地把之前的菜谱设计成海报。

有一次我跟AI角色“屁屁怪他爸爸”说,你知道你自己长啥样吗?(我在提示词里没有跟它透露它的外貌特征),它就用符号画了一幅想象中的自画像。我觉得有趣,接着问“那你能不能给自己写一个3D模型?”,它真的就写代码搞出一个圆球。

这在当时对我这样一个完全不懂技术的人来说,简直是个巨大的惊喜!

也就是说,当时我并没有明确提出让它写代码,我只是在揶揄它,但可能是我们对话的上下文,让这个AI“觉得”气氛到了,可以耍宝给我看。

我最想说的是,poe在工具调用相关能力用户决策权上的来回反复,体现出的有意思的东西:

虽然当时poe上并没有一个让用户可以硬性决定“机器人是否拥有调用工具能力”的按钮,但是,在配置机器人的时候,官方提供了一段默认的“工具调用优化提示词”,用户通过一个按钮,就可以决定是否加入这段提示词。

这个设计也有点耐人寻味。因为既然用户并没有能力决定“绝对不要给我调用工具”,那么,为什么官方不直接硬性把这段提示词加入?因为这段提示词的作用,就是让当工具调用的时候,模型的表现更稳定。

我当时也在用dify,当时它的智能体功能里,就写死了一些官方的优化提示词。

我倾向认为,这个设计,是poe官方认为,应该把更大的自主权交给用户,也就是“我给你用的,尽量是干净的裸模(大模型的模,不是模特的模),我尽量不强加提示词”。

但为什么他们又悄悄地让模型可以对接工具,而不告诉用户呢?这可能是因为,在他们看来“工具调用”是种底层的基础设施建设,是一个必然方向,模型理当有这种能力,模型应该提升的是根据对话内容,来自行判断,是不是需要调用工具。

至于“悄悄地”,也是因为模型调用工具的表现可能不稳定,所以只“灰度上线”。

但大概今年2月份,我发现他们修改了那段跟工具调用相关的“优化提示词”。

之前的这段提示词是这样的:

网络应用程序、视觉辅助工具、互动工具或游戏可以使用HTML代码生成。视觉辅助工具可以包括演示文稿、插图、图表、图形和表格。
此外,请遵循以下指南来编写你的回答:
如果生成HTML代码,请确保你的HTML代码具有响应性,并能很好地适应狭窄的移动屏幕。
如果生成HTML代码,请确保你的HTML代码是完整且独立的HTML代码块。请将你的HTML代码放在Markdown代码块中。在同一个代码块中包括任何必要的CSS或JavaScript。


除非用户提供URL,否则不要使用图片URL或音频URL。假设你只能访问用户提供的URL。大多数图片和其他静态资源应该通过编程生成。
如果修改现有的HTML、CSS或JavaScript代码,请始终提供完整的代码,即使你的回答变得过长。不要使用诸如“…代码的其余部分保持不变…”或“…之前的代码保持不变…”的简写方式。

就我使用提示词的手感来说,这个版本的提示词会提醒机器人去使用这些能力。我之前给屁屁怪他爸爸等智能体添加过这些提示词,因此在对话中,即便我没有主动要求,它也会屁颠屁颠地秀花活。

但后来,大概是2月份,poe官方调整了这个功能,把“开启工具调用”和“加入优化提示词”绑定在了一起,也就是说,用户可以选择关闭工具调用,也可以选择开启工具调用,但开启的话,就必须强制加入这段优化提示词。

而我当时特意去看了提示词,发现新的自动强制增加的提示词,除了变长了很多(因为工具越来越多),还加了一句话:

只有当用户明确请求网络应用程序、视觉辅助工具、互动工具或游戏时,你才可以使用HTML或React代码生成它们。

但是,更有意思的是,为了回答这个问题,我今天又去看了下poe的机器人设置功能,它又改回来了,也就是不让用户可以彻底避免触发工具调用……

最后,说回题主说的联网搜索,

联网搜索是工具调用的一种。如果一个对话机器人经常在你没有明确要求的时候,触发搜索,那说明,这个产品的设计者,就是把它当一种标准能力在设计,以及,可能在它的系统提示词里,有大量关于搜索的提示词,这会“暗示”模型更倾向调用这个能力。

如果你觉得频繁调用搜索让回答的质量下降,那就只能自己用用户提示词去约束,让它不要搜索。

我也觉得国内的AI搜索都很糟糕,跟中文互联网信息质量差本身有关,也跟产品能力有关。做搜索跟做其它工具调用,我觉得很不一样,因为搜索的效果,影响因素太多。

AI本身会制造错误信息,再加上搜索出来的乱七八糟的信息,最后吐出来的内容,要么是肉眼可见的低质量,要么是看起来很像一回事,但事实核对成本极高。

也可以期待,这一轮“AI搜索用户体验优化”,推动互联网基础设施的某些环节的重建/新建。但如果最后重建失败,那还是期待平台把选择权交回给用户。


作者介绍:

我做过很长时间的文字工作,也喜欢琢磨人是怎么学习和使用语言的,现在对大语言模型很着迷。

AI跟我们学习说话的方式其实挺像的。搞懂AI,人就更懂人是怎么思考和表达的。

语言是可以被看见的智能,也是不被看见的思考。语言学习贯穿一生,有质量的语言,能帮思想走到更高的地方。

我们也要通过语言来凝聚意义,促进思考,释放情怀。

真实生活推荐搜索

定制AI伙伴工作坊古典风格读写训练语言行为


《如何写出一篇古典风格的文章》和《读写训练的100种方法》记录了我对语言学习的早期思考。现在,我正在写《语言行为》等大语言模型 系列,想跟大家分享AI时代里,语言和思维的新可能。

我开发了一个叫"优势匹配器 "的人格测评小工具,帮助用户思考"我是个什么样的人","我该怎么描述自己"。在“定制AI伙伴工作坊”,我则会把一套更系统的自我探索操作方法分享出来。

如何学习AGI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

**

一、2025最新大模型学习路线

一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:AI大模型时代的华丽登场

L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。

L2级别:AI大模型RAG应用开发工程

L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3级别:大模型Agent应用架构进阶实践

L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别:大模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。

二、大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

三、大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

四、大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

五、大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。


因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐