万众期待的 ChatGPT 插件功能,终于向所有 Plus 用户敞开了大门。作为一名热衷于探索 AI 前沿应用的博主,我自然是第一时间投入了测试。坦白说,在(更新至 2025-05)这个时间点回顾,当初对这些插件的期望值或许有些过高,实际体验下来,心情可谓是五味杂陈。这篇文章,我将和大家分享我对四个品类共计 11 个 ChatGPT 插件的详尽测试过程与真实感受,希望能为同样好奇的你提供一些参考。
迈出第一步:轻松启用 ChatGPT 插件
启用插件功能其实非常简单,只需几步设置即可开启新世界的大门。
首先,你需要进入 ChatGPT 的 Settings
(设置)界面。在这里,你会看到两个关键的选项:Web Browsing
(网页浏览)和 Plugins
(插件)。你需要确保这两个选项都已开启。前者是 ChatGPT 官方提供的联网功能,而后者则是通往海量第三方插件的入口。
设置完成后,在 GPT-4 模型下,你就会发现除了默认的 Default
模式,新增了 Web Browsing
和 Plugins
选项。一个小小的遗憾是,官方的网页浏览功能和第三方插件目前还不能同时启用,你需要在它们之间做出选择。
要安装插件,只需在 Plugins
模式下,点击那个显示”No plugins enabled”(未启用插件)的下拉菜单,便会看到 Plugin store
(插件商店)的选项。进入商店,你就能浏览当前所有可用的第三方插件了,可以按照最新、最流行或全部列表进行筛选。看到心仪的插件,点击 Install
(安装)按钮即可。
大部分插件的安装都非常直接,但也有例外。比如 Zapier 这个强大的自动化工具,由于它需要连接你的众多个人服务,安全性尤为重要。因此,在安装 Zapier 插件前,系统会引导你先开启账户的两步验证。按照提示完成验证后,再回到 ChatGPT 插件商店点击安装,并在弹出的授权窗口中允许 ChatGPT 访问你的 Zapier 账户,整个安装过程便顺利完成了。安装完毕后,你就可以在 ChatGPT 中同时启用最多三个插件,组合它们来完成更复杂的任务。
上网冲浪哪家强?ChatGPT 插件联网能力大比拼
对于许多用户而言,让 ChatGPT 能够联网获取最新信息,无疑是插件系统最令人期待的功能之一。 在这个类别中,我重点测试了三个插件:ChatGPT 官方的 Browsing
插件,以及两款第三方上网插件——WebPilot
和 Keymate AI Search
。
官方 Browsing 插件初体验
我给官方 Browsing
插件的第一个任务是:”请帮我找出权威媒体中讨论 AI 对工作影响的最流行的三篇文章。” 发出指令后,可以看到 ChatGPT 开始执行上网浏览的动作,它搜索的关键词是”最流行的关于 AI 影响工作的文章”。它不仅搜索,还会尝试点击进入搜索结果中的网址。
在测试过程中,我注意到它能够成功读取部分网站的内容,但也有一些网站会遇到读取失败的情况。值得肯定的是,它找到的网站相关性都比较高,确实包含了不少关于 AI 与工作主题的讨论。它甚至还挖掘到了一篇 2019 年 11 月 20 日的文章,题为《人工智能会影响哪些工作?薪资更高、受教育程度更高的工人面临最大的风险》,在当时来看,这确实是一篇颇具前瞻性的分析。
然而,首次尝试的结果不尽如人意,大部分内容读取失败,系统提示需要重试。在允许它重新尝试后,经过一番”努力”,它终于给出了一些结果。虽然最终只找到了两篇文章,但质量都还不错。第一篇是来自《哈佛商业评论》的《生成式 AI 可能如何破坏创造性工作》,文章提出了 AI 支持人类创新、AI 创作廉价内容挤压人类创作者以及人类创作内容要求溢价等三种未来情景,链接有效,内容准确。第二篇是高盛 (Goldman Sachs) 的报告,指出 AI 可能对劳动力市场造成重大破坏,自动化三分之二的工作,影响全球多达三亿个工作岗位,但同时也会创造新的就业机会。这条结果附带的三个链接都指向同一篇报告,内容无误。总的来说,虽然数量未达预期,但官方插件找到的内容质量尚可,基本达到了我的期望。
第三方上网插件的表现又如何?
接下来,我切换到第三方插件模式,选择了 WebPilot
、World News
(一个世界新闻插件)和 Keymate AI Search
。我向它们发出了同样的指令,并额外加了一句”要找最新的、近期的文章”,以避免再次出现过时的信息。
首先响应的是 Keymate AI Search
。它尝试搜索”AI 对工作影响的最新讨论”,但不幸的是,返回结果过大导致出错。几次尝试失败后,ChatGPT 决定放弃 Keymate AI Search
,转而从 World News
插件获取信息。最终,World News
返回了一堆内容,包括像新浪的”数字技术赋能产业发展”、”全球物流行业加速变革转型”等,但仔细一看,这些文章与我要求的”AI 对工作影响”主题几乎毫无关联。更糟糕的是,ChatGPT 根据这些信息总结出的三篇文章,其链接无一例外全部是 404 错误页面。
随后,我单独测试了 WebPilot
。为了避免干扰,我重新开启了一个新的聊天窗口,并明确指示”请 WebPilot 来帮我找出…”。WebPilot
调用了谷歌搜索,一番操作后也给出了一些结果。然而,令人失望的是,这些链接依然指向 404 页面。
这让我不禁怀疑,是不是我给它们的任务太复杂了?于是,我尝试了一个更简单的查询:”特斯拉当前的股价是多少(更新至 2025-05)?”
官方 Browsing
插件很快给出了结果:167.3 美元(更新至 2025-05),标注为 5 月 16 日的数据。当时我测试的时间是 5 月 18 日,虽然数据有两天延迟,但核对后发现 16 日的价格基本准确,勉强算过关。
切换到第三方插件,首先是 WebPilot
。它表现出色,准确给出了 5 月 18 日的收盘价 176.89 美元(更新至 2025-05),还附带了涨幅和盘后交易信息,堪称完美。
而 Keymate AI Search
的表现则令人大跌眼镜。我明确指示由它来回答,它也确实被调用了。然而,它给出的特斯拉当前股价是 650.23 美元(更新至 2025-05),并附上了一个来源链接。点开来源后,我完全无法理解这个数字是如何得出的。这一轮测试,Keymate AI Search
无疑是失败了。
解读与学习:深入剖析 ChatGPT 插件在 PDF 与视频处理上的能力
除了上网,利用 AI 进行学习和信息总结也是一个重要的应用场景,因此我对 PDF 和视频处理类插件抱有很高期待。 我测试了包括 Wolfram
、Video Insights
、Ask Your PDF
和 Chat with PDF
在内的几款插件。
Wolfram:计算与可视化的利器
Wolfram
是一个强大的计算科学和数据可视化工具。我首先让 ChatGPT 借助 Wolfram
插件绘制 sin(x)cos(y)
的三维曲线。在短暂的思考后,ChatGPT 正确判断出这个问题应该交给 Wolfram
处理,并成功调用插件绘制出了精美的图形。这个过程流畅且结果完美,充分体现了优质插件背后强大平台的实力。本质上,这相当于通过自然语言描述,让 ChatGPT 调用了 Wolfram
的 API 来完成专业任务。
Video Insights:视频内容总结的尝试
接下来是视频总结插件 Video Insights
。我先从我的 YouTube 频道选择了一个关于”自动筛选 RSS 神器”的视频链接给它。ChatGPT 迅速识别出应由 Video Insights
处理,并很快给出了视频的标题和简介。但它也特别提示,由于视频时长超过了十分钟,无法提供更详细的内容摘要。这让我知道了该插件的第一个限制:视频时长不能超过 10 分钟。
于是,我换了一个时长约 8 分钟,关于 MidJourney 图片收集和分类的带字幕视频。这次,Video Insights
给出了非常详细的摘要内容,准确概括了视频的几乎所有要点,表现不错。
我又找了一个时长 9 分钟,关于星舰发射但没有字幕的视频。将链接发给它后,经过数次尝试,插件最终未能返回任何结果,任务失败。由此可见,Video Insights
目前的功能范围是:总结时长不超过 10 分钟且带有字幕的视频。与市面上早已存在的各种浏览器插件或专用工具相比,它并未展现出明显的优势。
PDF 处理双雄:Ask Your PDF 与 Chat with PDF
在 PDF 处理方面,我选择了 Ask Your PDF
和 Chat with PDF
两款插件。我准备了两份 PDF 文档:一份是我自己的一篇博文转换成的 PDF,内容较短,大约八九页;另一份则是前些天 OpenAI CEO 萨姆·奥特曼 (Sam Altman) 参加听证会的视频字幕转换成的 PDF,内容较长,约有八九十页。我将这两份 PDF 上传到谷歌网盘,并获取了分享链接。
首先测试的是短 PDF(我的博文)。我让 ChatGPT 总结这份 PDF 的要点。它先调用了 Chat with PDF
,但该插件出错。随后,ChatGPT 自动切换并调用了 Ask Your PDF
,这体现了其处理任务的灵活性。Ask Your PDF
成功读取了文章并给出了摘要总结。为了进一步验证其理解程度,我问了一个关于文章内容的问题:”作者用什么方式来总结长文?” 它准确回答道:”作者提到了他使用几种工具来处理和总结长文”,这与我的原文内容一致。Ask Your PDF
在处理短文档方面表现合格。
接着是长 PDF(奥特曼听证会字幕)。我重新打开一个对话窗口,将长 PDF 的链接发给 ChatGPT。这次 Chat with PDF
成功返回了结果,给出的总结内容基本正常。听证会中有一个细节令人印象深刻:奥特曼 (Altman) 表示他并未持有 OpenAI 公司的股份,其收入仅够支付健康保险。于是我向 Chat with PDF
提问:”当被问及’You make a lot of money, do you?’(你赚了很多钱,是吗?)时,奥特曼 (Altman) 是如何回答的?” Chat with PDF
的回答是:”萨姆·奥特曼 (Sam Altman) 并没有直接回答这个问题。” 我查阅了字幕原文,发现奥特曼 (Altman) 的确是在这个问题后说出了那段著名的回答:”我只赚取了足够支付我的健康保险的费用,我没有拥有 OpenAI 的股份。”
既然 Chat with PDF
没能给出准确答案,我又把同样的问题抛给了 Ask Your PDF
。它对长 PDF 的总结与 Chat with PDF
几乎一模一样,对那个关键问题的回答也如出一辙,未能提供奥特曼 (Altman) 的原话。
为了对比,我使用了一个独立的在线工具 ChatPDF.com。上传同一份长 PDF 后,我直接问它奥特曼 (Altman) 是如何回答那个问题的。ChatPDF.com 迅速给出了答案:”根据文档第 49 页,当被问及这个问题时,萨姆·奥特曼 (SAMUEL ALTMAN) 的回答是’我只赚取支付我国健康保险的费用。'” 这与原文完全一致。仅从这份长 PDF 的测试来看,ChatGPT 内的这两款 PDF 插件效果暂时还比不上专门的外部工具。
完整视频请点击观看:
https://youtu.be/9WSzfeMw6ZY
效率工具测评:Prompt Perfect 与 Zapier 的实际效用
工具类插件旨在提升我们的工作效率,我挑选了 Prompt Perfect
、Zapier
和 ShowMe
(一个流程图工具)进行测试,重点体验了前两者。
Prompt Perfect:提示语优化能手?
Prompt Perfect
声称可以帮助用户生成更好的提示语。使用方法很简单,在你的提示语前加上 “perfect” 这个词即可。我首先尝试让它帮我写一篇关于 ChatGPT 插件的爆款推文:”perfect 请帮我写一篇关于 ChatGPT Plugin 的爆款推文”。插件运行后,将我的提示语修改为:”请撰写一篇精准、全面、高质量的推文,介绍 ChatGPT 插件的热销特点。” 可以看到,它确实对我的原始 prompt 进行了一定的细化和扩充。
接着,我又让它帮我回复一封学员发来的感谢邮件,要求表达感谢。它将我的中文提示语转换成了英文,但优化后的提示语与我最初的想法相比,并没有感觉到质的飞跃。总的来说,Prompt Perfect
对于非常简短或粗略的提示语,或许能通过增加细节起到一些润色作用,但其具体能带来多大提升,我目前还不太确定,需要更多场景的测试。
Zapier:自动化流程的重量级选手
Zapier
插件无疑是本次测试中的一个重量级选手,它能够连接数千种应用和服务,构建自动化流程。我给它的第一个任务是:”请帮我做一个自动化的流程,把我喜欢的(点赞的)推文保存到一个 Notion 数据库当中去。” ChatGPT 正确地将任务交给了 Zapier。
Zapier 很快反馈说已经为我设计好了一个自动化流程,并提供了链接。点击链接进入 Zapier 后,发现它确实创建了一个 Zap。但在检查细节时,我发现触发事件 (Trigger) 被设置成了 “User Tweet”(用户发推),而不是我要求的 “Liked Tweet”(点赞推文)。不过,在后续的动作 (Action) 中,它正确选择了在 Notion 中创建一个数据库项目 (Item),并添加了”推文”这个字段,这点做得不错。对于这个简单的流程,除了触发事件的小差错,大体上是成功的。
然而,当我们使用自动化工具时,这类简单流程往往自己就能轻松创建。更有价值的场景或许是处理复杂需求,尤其是需要结合多个插件来协同完成的任务。于是,我给出了一个更复杂的自动化流程要求,类似于我内容创作 Notion 模板中的一项功能:监控”已发布视频”数据库,当项目有改动时,判断 video ID
字段是否为空。若为空,则写入”没有 ID”;若不为空,则去”内容创作”数据库查找具有相同 video ID
的项目,并将其状态修改为”已完成”。
在长时间的”思考”后,Zapier 表示创建自动化流程时遇到了问题,可能是网络流量过大或配置错误。我多次尝试,甚至重新打开对话窗口,均未能成功。因此,目前来看,ChatGPT 中的 Zapier 插件在处理复杂的自动化流程方面似乎还力有不逮。
全局性核心要点总结
经过这一系列详尽的 ChatGPT 插件测试,我总结出以下几点核心体会:首先,插件系统无疑为 ChatGPT 打开了新的可能性,具有一定的实用价值,但远未达到某些宣传中那般”惊艳”的程度,部分插件甚至谈不上”好用”。其次,插件的质量良莠不齐,这可能与插件开发门槛相对较低有关,未来筛选优质插件本身就会成为一项挑战;一个插件的真正实力,很大程度上取决于其背后所依托的平台能力。再次,我衷心希望 OpenAI 未来不要走上类似某些搜索引擎过度依赖广告的商业模式,保持产品的纯粹性。最后,单个插件的表现目前看来大多平平,其更大的潜力或许在于多个插件的协同工作,通过 ChatGPT 的智能调度,实现类似 AutoGPT 的复杂任务处理。
独特深度洞见
在我看来,现阶段(更新至 2025-05)的 ChatGPT 插件,更多的是扮演着”连接器”的角色,它们将 ChatGPT 的能力延伸到了外部世界(如实时网页、特定数据库),但尚未从根本上”增强”其核心的推理、创造或理解能力。许多插件所实现的功能,在独立的应用程序或浏览器扩展中早已存在,且往往更为成熟和强大。因此,插件生态的价值,除了便捷性之外,更深远的意义可能在于能否真正催生出超越现有单点工具能力、由 AI 驱动的全新应用范式。这需要插件开发者、OpenAI 平台以及用户三方共同探索和推动。