豆包或deepseek为啥要悄悄“联网搜索”?
联网搜索是工具调用的一种。如果一个对话机器人经常在你没有明确要求的时候,触发搜索,那说明,这个产品的设计者,就是把它当一种标准能力在设计,以及,可能在它的系统提示词里,有大量关于搜索的提示词,这会“暗示”模型更倾向调用这个能力。如果你觉得频繁调用搜索让回答的质量下降,那就只能自己用用户提示词去约束,让它不要搜索。我也觉得国内的AI搜索都很糟糕,跟中文互联网信息质量差本身有关,也跟产品能力有关。做搜
本文最早发表在知乎。原问题是:“deepseek在我没有点亮联网搜索的时候,它自己显示出联网搜索了,如何解释,或者说意味着什么?”。
这跟产品设计理念有关,也跟现在国内各模型大厂的风格有关,都是先把功能推出,好不好再说,一边搜集用户反馈一边做优化。
豆包也是一样的,它底部都没有让你选择是不是联网的按钮。它也会在思考过程中主动调用搜索工具。
我是poe.com用户,从去年下半年开始用它。我介绍下poe这个平台对工具调用的处理方式,可能大家就更好理解了。
首先,跟国内这些平台最大的不同是,poe.com上面能集成了很多主流的大模型,所以,工具调用的稳定性,去年10月份的时候,如果用的是当时Claude3.5这种水平的模型,已经可以做得相当不错了。
那个时候MCP这个概念还没有出来,“工具调用”只停留在业内人士的认知里,认为会是很有潜力的方向。
有意思的是,在poe上面,其实他们一直一点点地给模型加工具调用的能力,但是悄悄进行,并没有说加了一个能力,就要广而告之。这就导致,很多用户根本不知道,他们除了可以跟机器人聊天,其实还可以让机器人写代码,画画,做一些简单的设计,或者写个马上能玩的小游戏……
比如我在上面创建过一个叫Maxchef的大厨角色,有一次我说,如果你在推荐菜谱的时候能图文并茂地画出来就好了,它就激动地把之前的菜谱设计成海报。
有一次我跟AI角色“屁屁怪他爸爸”说,你知道你自己长啥样吗?(我在提示词里没有跟它透露它的外貌特征),它就用符号画了一幅想象中的自画像。我觉得有趣,接着问“那你能不能给自己写一个3D模型?”,它真的就写代码搞出一个圆球。
这在当时对我这样一个完全不懂技术的人来说,简直是个巨大的惊喜!
也就是说,当时我并没有明确提出让它写代码,我只是在揶揄它,但可能是我们对话的上下文,让这个AI“觉得”气氛到了,可以耍宝给我看。
我最想说的是,poe在工具调用相关能力用户决策权上的来回反复,体现出的有意思的东西:
虽然当时poe上并没有一个让用户可以硬性决定“机器人是否拥有调用工具能力”的按钮,但是,在配置机器人的时候,官方提供了一段默认的“工具调用优化提示词”,用户通过一个按钮,就可以决定是否加入这段提示词。
这个设计也有点耐人寻味。因为既然用户并没有能力决定“绝对不要给我调用工具”,那么,为什么官方不直接硬性把这段提示词加入?因为这段提示词的作用,就是让当工具调用的时候,模型的表现更稳定。
我当时也在用dify,当时它的智能体功能里,就写死了一些官方的优化提示词。
我倾向认为,这个设计,是poe官方认为,应该把更大的自主权交给用户,也就是“我给你用的,尽量是干净的裸模(大模型的模,不是模特的模),我尽量不强加提示词”。
但为什么他们又悄悄地让模型可以对接工具,而不告诉用户呢?这可能是因为,在他们看来“工具调用”是种底层的基础设施建设,是一个必然方向,模型理当有这种能力,模型应该提升的是根据对话内容,来自行判断,是不是需要调用工具。
至于“悄悄地”,也是因为模型调用工具的表现可能不稳定,所以只“灰度上线”。
但大概今年2月份,我发现他们修改了那段跟工具调用相关的“优化提示词”。
之前的这段提示词是这样的:
网络应用程序、视觉辅助工具、互动工具或游戏可以使用HTML代码生成。视觉辅助工具可以包括演示文稿、插图、图表、图形和表格。
此外,请遵循以下指南来编写你的回答:
如果生成HTML代码,请确保你的HTML代码具有响应性,并能很好地适应狭窄的移动屏幕。
如果生成HTML代码,请确保你的HTML代码是完整且独立的HTML代码块。请将你的HTML代码放在Markdown代码块中。在同一个代码块中包括任何必要的CSS或JavaScript。
除非用户提供URL,否则不要使用图片URL或音频URL。假设你只能访问用户提供的URL。大多数图片和其他静态资源应该通过编程生成。
如果修改现有的HTML、CSS或JavaScript代码,请始终提供完整的代码,即使你的回答变得过长。不要使用诸如“…代码的其余部分保持不变…”或“…之前的代码保持不变…”的简写方式。
就我使用提示词的手感来说,这个版本的提示词会提醒机器人去使用这些能力。我之前给屁屁怪他爸爸等智能体添加过这些提示词,因此在对话中,即便我没有主动要求,它也会屁颠屁颠地秀花活。
但后来,大概是2月份,poe官方调整了这个功能,把“开启工具调用”和“加入优化提示词”绑定在了一起,也就是说,用户可以选择关闭工具调用,也可以选择开启工具调用,但开启的话,就必须强制加入这段优化提示词。
而我当时特意去看了提示词,发现新的自动强制增加的提示词,除了变长了很多(因为工具越来越多),还加了一句话:
只有当用户明确请求网络应用程序、视觉辅助工具、互动工具或游戏时,你才可以使用HTML或React代码生成它们。
但是,更有意思的是,为了回答这个问题,我今天又去看了下poe的机器人设置功能,它又改回来了,也就是不让用户可以彻底避免触发工具调用……
最后,说回题主说的联网搜索,
联网搜索是工具调用的一种。如果一个对话机器人经常在你没有明确要求的时候,触发搜索,那说明,这个产品的设计者,就是把它当一种标准能力在设计,以及,可能在它的系统提示词里,有大量关于搜索的提示词,这会“暗示”模型更倾向调用这个能力。
如果你觉得频繁调用搜索让回答的质量下降,那就只能自己用用户提示词去约束,让它不要搜索。
我也觉得国内的AI搜索都很糟糕,跟中文互联网信息质量差本身有关,也跟产品能力有关。做搜索跟做其它工具调用,我觉得很不一样,因为搜索的效果,影响因素太多。
AI本身会制造错误信息,再加上搜索出来的乱七八糟的信息,最后吐出来的内容,要么是肉眼可见的低质量,要么是看起来很像一回事,但事实核对成本极高。
也可以期待,这一轮“AI搜索用户体验优化”,推动互联网基础设施的某些环节的重建/新建。但如果最后重建失败,那还是期待平台把选择权交回给用户。
作者介绍:
我做过很长时间的文字工作,也喜欢琢磨人是怎么学习和使用语言的,现在对大语言模型很着迷。
AI跟我们学习说话的方式其实挺像的。搞懂AI,人就更懂人是怎么思考和表达的。
语言是可以被看见的智能,也是不被看见的思考。语言学习贯穿一生,有质量的语言,能帮思想走到更高的地方。
我们也要通过语言来凝聚意义,促进思考,释放情怀。
真实生活推荐搜索
定制AI伙伴工作坊古典风格读写训练语言行为
《如何写出一篇古典风格的文章》和《读写训练的100种方法》记录了我对语言学习的早期思考。现在,我正在写《语言行为》等大语言模型 系列,想跟大家分享AI时代里,语言和思维的新可能。
我开发了一个叫"优势匹配器 "的人格测评小工具,帮助用户思考"我是个什么样的人","我该怎么描述自己"。在“定制AI伙伴工作坊”,我则会把一套更系统的自我探索操作方法分享出来。
如何学习AGI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取