大家好,我是 Axton。随着 AI 技术的飞速发展,尤其到了 2025 年(更新至 2025-05),我们对 AI 的期待早已超越了简单的对话。我们希望 AI 能够真正为我们执行任务,连接现实世界的数据与服务。今天,我将带你深入探索 GPTs Function Calling 这一强大功能,它正是实现这一目标的关键。读完本文,你将明白如何让你的 GPT 不再仅仅是个聊天机器人,而是成为一个能调用外部工具、处理复杂任务的得力助手。
为何 GPTs Function Calling 如此重要?
要想让你开发的 GPT 在竞争激烈的 GPT 商店中脱颖而出,掌握 Actions 功能,特别是 GPTs Function Calling,是提升其核心竞争力的关键。 在我看来,一个卓越的 GPT 需要在三个核心方面下功夫:一是精心设计的 Prompt,它决定了 GPT 的行为逻辑和表现上限;二是独特且高质量的数据,这是形成差异化优势的基石;而第三,也是我们今天讨论的重点,就是 Actions。
Actions 赋予了 GPT 超越其内置知识库的能力,如同给它装上了三头六臂,使其能够连接外部世界,执行更复杂、更实用的任务。在我之前的分享中,我们已经探讨过如何通过 Zapier 来扩展 GPT 的能力,那是一种相对便捷的方式。然而,如果我们追求更深度的定制化和更强大的控制力,那么 GPTs Function Calling 便是我们必须掌握的进阶技能。它允许 GPT 直接调用外部 API,获取实时信息或执行特定操作,从而极大地扩展了 GPT 的应用场景和能力边界。
揭秘 GPTs Function Calling:从概念到实践
GPTs Function Calling 的核心在于让 GPT 能够”指挥”其他软件或服务为它工作,实现一种”由内向外”的能力扩展。 这与我之前视频中介绍的 Assistants API 有着本质区别。Assistants API 更侧重于”由外向内”,即让你的自有软件或应用获得 ChatGPT 的 AI 能力加持。而 GPTs Function Calling 则是增强 ChatGPT 本身,使其能够主动调用外部函数来完成任务。
你可能会担心这涉及到编程知识,但请放心,即使你不是程序员,跟随我的步骤,也完全能够理解并实现一个具备 Function Calling 能力的 GPT。我们将从零开始,一步步构建一个能够获取并展示加密货币价格走势的 GPT,让你亲身体验 GPTs Function Calling 的魅力。
实战演练:构建一个加密货币行情 GPTs Function Calling 应用
现在,让我们卷起袖子,实际操作一番,看看如何一步步为我们的 GPT 添加 Function Calling 的”超能力”。 我们将以一个获取加密货币月度价格数据并绘制图表的 GPT 为例。这个过程的关键在于配置 Action,特别是定义 API 的调用方式。
准备工作:目标与 API 选择
我们的目标是让 GPT 能够根据用户指令,从第三方服务获取特定加密货币(比如比特币 BTC 或以太坊 ETH)的月度价格数据,然后利用其内置的 Code Interpreter 功能将这些数据可视化成图表。
要实现这一点,我们首先需要找到一个提供相关数据的 API。网络上有很多提供免费 API 接口供练习和测试的平台,例如 Alpha Vantage 就提供了丰富的金融数据 API。在他们的文档中,我们可以找到获取加密货币月度数据的具体 API 端点、请求 URL、必要的参数(如 function
, symbol
, market
)以及可选参数等信息。即使你不能完全理解每一个参数的含义,也不必过于担心,因为我们稍后会借助工具来处理这些信息。
核心步骤:生成 OpenAPI Schema
配置 Action 的核心在于提供一个符合 OpenAPI 规范的 Schema,它本质上是对你将要调用的 API 的一份详细”说明书”。 这个 Schema 会告诉 GPT 如何正确地构造请求、需要哪些参数以及如何理解返回的数据。OpenAI 官方推荐使用 OpenAPI 3.1.0 版本(更新至 2025-05)的规范。
你可能会想,手写这个 Schema 也太复杂了!的确如此,所以我们通常会借助 GPT 本身来完成这项工作。在 API 文档中,通常会提供一个代码片段(Snippet),展示了如何用某种编程语言(如 Python、JavaScript 等)调用该 API。我们只需要将这个代码片段,连同 API 返回的响应数据示例(Example Response)一起提供给一个专门用于生成 Schema 的 GPT(我称之为 “GPT Builder 助手”,你也可以直接在 ChatGPT 对话框中通过 Prompt 指示它完成),它就能为我们自动生成符合规范的 Schema。例如,我当时就复制了 API 文档中的 Python 代码片段和 JSON 格式的示例返回结果,让 GPT Builder 助手帮我生成了所需的 Schema。
配置与测试:让 Action 跑起来
拿到生成的 Schema 后,我们回到 GPT 的配置界面,在 “Actions” 部分点击 “Create new action”,然后将 Schema 粘贴进去。如果 Schema 格式正确,系统会自动识别出 API 的调用方法(如 GET)、路径(Path)和查询参数(Query Parameters)。
接下来是关键的认证(Authentication)环节。大多数有价值的 API 都需要 API Key 进行身份验证,以确保安全和追踪使用情况。我们需要在 GPT Action 配置的 “Authentication” 部分填入从 API 服务商那里获取的 API Key。我一开始测试时就忘了配置 API Key,导致调用失败,GPT 的调试信息清晰地指出了问题所在。正确配置 API Key 后,再次点击 “Test” 按钮,并同意信任该服务器。
如果一切顺利,GPT 就会成功调用 API,获取数据,并使用 Code Interpreter 将其绘制成图表。我第一次成功测试时,它就漂亮地画出了比特币过去一年多的月度价格走势图,这标志着我们的 Function Calling Action 已经能够正常工作了!
验证与扩展:以太坊行情一图掌握
为了进一步验证,我又尝试用中文向 GPT 发出指令,让它获取以太坊(ETH)的价格走势。尽管它一开始似乎对我的指令有些”挑剔”,要求我提供更多信息,但这可能与我当时的 Prompt 设计有关。稍作调整或重新生成后,GPT 成功地调用了我们配置的 Action,获取了以太坊过去一年多的月度价格数据,并同样用 Code Interpreter 绘制出了清晰的走势图。
这个过程充分证明了我们构建的 GPT 能够正确地调用 Function Calling Action,获取外部数据,并结合自身能力(如 Code Interpreter)完成复杂任务。虽然这只是一个相对简单的演示,但它为你打下了坚实的基础。你可以基于这个原理,为你的 GPT 添加更多、更强大的 Action,满足各种独特的需求。
完整视频请点击观看:
全局性核心要点总结
通过今天的分享,我希望你能掌握 GPTs Function Calling 的核心价值。首先,它极大地扩展了 GPT 的能力边界,使其不再局限于已有的知识库,而是能够与外部世界进行实时交互。其次,理解并正确配置 OpenAPI Schema 是实现有效函数调用的关键,但这并非遥不可及,我们可以借助 AI 工具来简化这一过程。再者,API 的认证机制(如 API Key)是保障安全和顺利调用的重要环节,不可忽视。最后,通过实际案例,我们看到 GPTs Function Calling 可以将数据获取、处理与可视化等多个步骤流畅地整合起来,创造出真正实用的 AI 应用。
独特深度洞见
在我看来,GPTs Function Calling 的真正意义在于,它标志着 AI 从一个”知识问答者”向一个”任务执行者”的转变。通过赋予 GPT 调用外部函数的能力,我们实际上是在构建一个可以理解自然语言指令,并能自主规划、调用工具、最终完成复杂任务的智能代理。这不仅仅是功能的增强,更是 AI 应用范式的一次深刻革新,为未来构建更强大、更自主的 AI 系统铺平了道路。
如果你对 Google 在人工智能领域的最新进展感兴趣,更多细节可参考我的上一篇文章 👉 Google I/O 2025 有哪些值得关注的人工智能新技术?