让豆包给你写一个年会抽奖转盘,它完美完成了;让Trae写一个批量下载图片的脚本,它也实现了。但这些代码都是封闭、孤独的。

当你不再满足于本地代码的能力,想实时获取天气、时间信息,想让你的代码睁眼看世界。恭喜你,长大了。

会调用API就是AI编程者的一个成年礼。

API 是什么?

API 这三个字看起来抽象,其实就是一个标准化的、现成的、带有特定功能的软件接口。我们搞AI编程的甚至没必要了解它的全称到底是什么。

如果把编程比作做菜,那调用 API 就相当于使用超市买来的成品菜、调料。比如做红烧肉,常规操作需要先炒肉,再按顺序放各种调料。但如果有现成的红烧肉料汁,炒完肉直接倒进去就能成菜。购买这个酱料,就相当于调用 API——用约定好的方式,使用一个功能稳定的软件服务。

AI 编程最常用的,就是调用大语言模型的 API。有了它,我们就能在自己的小工具、小产品上实现 AI 生成文字、生成图片等功能。

如何调用 API?

传统方式很繁琐,AI编程者调用它就三步。

第一步:找到API的技术文档

这是最关键的一步,它决定了我们能否正确调用 API。这类技术文档里面,厂商会直接提供调用的代码示例。

以调用Doubao-Seed-1.6 API 为例:豆包的 API 提供商是火山引擎,我们需要去火山引擎官网找到豆包API的使用手册链接或者调用示例。

待会就可以把这个链接或者代码调用示例发给 AI 编程工具(比如 Cursor/Qoder)让它阅读。因为大部分AI编程工具现在都具备阅读外部网页内容的能力,这样一来,AI就获取了正确调用API的规则。

第二步:获取 Key 和 URL

只是知道调用规则不行,想获取API的能力还需要付费。所以调用 API 最终还需要两样东西:

URL:告诉代码去哪里找这个 API。这个一般API厂商官网都有写。我们将API使用链接给AI的时候,AI自己能找到这个参数。

Key:使用 API 的”钥匙”,付费后生效。

这是豆包的KEY生成页面。点击蓝色按钮创建API key,根据指引确认即可。最后别忘了充点钱进去,否则用不了。

第三步:全部都让AI帮我们干

遵守API的调用规则找到URL, 再拿着这个Key,本地的程序就能够使用到API的能力。当然,这些都不需要我们亲自做。

获取到**技术文档、URL 和 Key **后,把这些信息统统提供给 AI 编程工具,它就能根据你的需要帮你生成调用 API 的程序。

我这里,就调用豆包的API制作一个小小的对话机器人。以Qoder为例,智能体模式下,提示词很简单:API的调用规则请你查看链接[API使用链接],API KEY为[你的key],请你帮我做一个基于豆包Doubao-Seed-1.6的对话机器人网页。

然后就等他完成。当然中途大概率会出现一些bug,我们就把bug告诉AI让它继续修改就行了。

你看,真就一句话就生成了一个对话机器人。

注:目前很多API厂商的新用户注册都有免费额度,作为学习者,及时关注最新的政策用这些免费的额度即可。不知道哪里有免费羊毛的可以私信我,我这边有个邀请码可以给新用户送30元额度,最关键还能无痛体验到Claude/Banana Pro等顶级模型。

去申请一个API Key吧

API 的用法远不止做对话机器人。它的最大价值在于:你可以 DIY 任何你想要的功能

比如我正在做一个证件照生成工具:在代码里预置好了打磨过的提示词。用户只要上传一张照片,就直接生成一张标准的证件照。而不需像传统的对话式AI,需要告诉AI生成的照片风格、尺寸、背景色等等信息。

再比如,你可以做一个批量生图工具:同一个提示词,点击一次按钮,调用 10 个不同的生图大模型的 API 同时生成 10 张图片。

这些功能,传统的通用式AI工具很难满足我们的需求,此时调用API就能完美解决。而且如果把这些小需求做到极致,体验做得足够好,它就能成为一个真正的产品。

简单后面的残酷

能否调用 API,是判断一个人是否是编程者的基本要素之一,也是从入门到进阶的核心标志点。

但通过AI编程,确实能快速上手 API 调用,做出简单的对话类、生图类小应用。但想做好,非常难

我们平时看到的豆包、Kimi、元宝这些 AI 对话机器人,界面看起来很简单——一个对话框,返回一堆信息。但实际上,不同的大模型背后有大量细节参数需要设定:图像格式是 URL 还是 Base64?尺寸大小如何让代码兼容?Token 数量怎么控制?

想要真正把 API 应用好,把它用到自己的工具里,需要掌握大量的背景知识。

这印证了我一直以来的观点:对普通人而言,AI可以帮你快速做出一个可交付的标准产品,但想要更高复杂度、更精细化的产品,你仍然需要从专业基础出发,去精雕细琢。系统化的编程工作,需要时间和经验的积累。

最后

AI 编程为普通爱好者打开了一扇门,让我们可以快速实现想法、解决轻量级需求。但真正想要做出有价值的产品,想法比技术重要。

好在,从调用第一个 API 开始,已经迈出了从使用者到创造者的关键一步。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐