大家好,我是 Axton。想象一下,如果有一个平台能让你免费使用强大的 GPT-4,甚至是拥有 128K 上下文窗口的 GPT-4 Turbo,你会不会心动?今天,我就带大家深入体验一下字节跳动推出的一站式 AI 平台 Coze,看看它究竟香不香。我们将从创建基础的对话机器人开始,逐步探索到多代理群聊机器人和数据库型知识库等稍复杂的功能,最后聊聊我对它的一些期待。
完整视频请点击观看:
Coze 平台初探:海外版与国内版的抉择
Coze 平台的核心吸引力在于其免费提供 GPT-4 系列模型,但海外版与国内版在模型选择上存在关键差异。
Coze.com 是字节跳动面向海外市场推出的 AI 开发平台,它允许用户无需编程就能创建集成知识库、工作流甚至多个代理的 AI 应用。最近,它也推出了国内中文版 Coze.cn。然而,一个关键的区别在于,国内版 Coze.cn 使用的是字节自研的”云雀大模型算法”,这一点在其使用须知中有明确说明。对于那些希望免费体验 GPT-4 的朋友来说,这显然不是最佳选择。因此,我今天的试用重点放在了 Coze.com 海外版。当然,中文版在对接国内生态方面有其独特优势,我们稍后再谈。
注册 Coze.com 账号的过程相当简单,但需要注意的是,它对使用地区有一定的限制,部分地区可能无法访问。注册完成后,点击”开始使用”便能进入平台首页。Coze.com 的界面默认为英文,为了方便大家理解,我使用了浏览器自带的翻译功能将其转为中文。
Coze 核心功能概览:构建智能 Bot 的基石
Coze 平台围绕 Bot(机器人)构建,通过插件、工作流和知识库赋予 Bot 强大的能力。
进入个人空间后,通过顶部的功能菜单,我们可以清晰地了解 Coze 的核心能力。首先,也是最核心的,就是创建机器人(Bot)。这些机器人可以通过集成插件(Plugins)来扩展其功能,这些插件类似于 GPTs 中的 Actions,或是 Zapier、Make 等自动化工具中集成的 App,例如商店中就展示了许多可供直接使用的插件。
除了插件,Bot 还可以集成工作流(Workflows),从而自动化执行一系列更复杂的任务。例如,平台提供了一个搜索亚马逊(Amazon)商品的工作流示例。用户不仅可以使用他人共享的工作流,也可以自定义创建。最后,机器人还可以连接到我们自己的知识库(Knowledge),从中获取信息进行回答。总结来说,Coze 的主要功能就是创建一个能够集成插件、工作流和知识库的智能机器人。
实战演练(一):打造专属知识库助手 Bot
通过实际操作,我们可以深入了解 Coze 创建 Bot 的流程和各项功能的具体配置。
今天我计划演示两个机器人:一个是个人的知识库助手,它能从我过往的视频和博客文章中学习并回答问题;另一个则会展示多代理(Multi-Agent)机器人的运作方式。
Bot 设定与模型选择
我们先来复现我之前在讲 OpenAI Assistant API 时提到的 Axton 知识库助手。在 Coze 中创建 Bot 时,界面主要分为三个部分。顶部可以选择单代理(Single-agent)或多代理(Multi-agent)模式。单代理模式意味着整个机器人内部只有一个 AI 核心,适合处理需要逐步深入的复杂任务。而多代理模式则包含多个小型 AI,它们可以进行群聊,适合更具个性化的任务,因为每个代理间的对话是独立的。我的知识库助手选择了单代理模式。
最令人兴奋的是模型选择。我将网页切换回英文版,以便大家对照。Coze.com 目前赫然支持 OpenAI 的 GPT-4 Turbo (128K 上下文),以及 GPT-4 (8K) 和 GPT-3.5 (16K),并且这些都是免费使用的,这无疑是它最大的亮点之一。右侧是预览窗口,方便我们在开发过程中随时测试机器人的表现。
技能树配置:插件、工作流与知识库
中间区域是为机器人配置”技能树”的地方。首先是插件(Plugins)。Coze 提供的插件数量目前不算多,我印象中大约有六十多个,包括了谷歌搜索(Google Search)、DALL·E 3 图像生成、GPT-4V 视觉识别、GitHub、谷歌学术搜索(Google Scholar)以及新闻资讯等。我随手添加了 DALL·E 3、GPT-4V 和 Scholar。
接下来是工作流(Workflows)。点击加号可以添加,这里有少量共享的现成工作流,如搜索抖音视频、亚马逊商品和论文等,总共五个。如果想使用,比如亚马逊搜索工作流,可以直接复制到自己的工作空间进行修改。创建新的工作流则涉及到语言模型调用、代码执行、知识库查询、条件跳转和变量设置等五个基本功能模块,也可以集成插件和其他工作流。工作流的创建相对复杂,我们这次先不深入演示。
知识库构建:网页与 CSV 数据导入实操
然后是与机器人记忆相关的知识库(Knowledge)。点击加号,我们可以选择已有的知识库或创建新的。我选择创建一个名为”内容大全”的新知识库。Coze 提供了多种知识库单元(Unit)的添加方式,主要分为文本(Text)和表格(Table)两大类。
在文本格式下,可以上传本地的 PDF、TXT、DOCX 文档,通过 URL 添加网页内容,甚至连接 Notion 数据库和页面。表格格式则支持本地的 Excel 或 CSV 文件,以及通过 API 获取 JSON 数据。我演示了两种方式:首先,在文本格式下通过 URL 添加在线数据。我输入了我的博客 URL (axtonliu.com),并设定了更新频率为七天,Coze 会自动爬取网站标题和内容。
接着,在表格格式下,我上传了一个 CSV 文件。这个文件包含了我的 YouTube 视频的 ID、URL 和标题等信息。上传后,需要对表格进行配置,关键是选择索引(Index)。因为我希望根据视频标题进行检索,所以我将”标题”列设为了索引。经过预览确认无误后,Coze 会对文件进行分片处理。这样,我的”内容大全”知识库就包含了来自博客网页和 CSV 文件的两部分内容。
变量与新兴的数据库功能
回到机器人创建界面,我将刚才创建的”内容大全”知识库添加给机器人。此外,还可以设定变量(Variables),这些变量能帮助机器人记录明确信息,避免 AI 胡乱猜测。例如,我创建了一个名为”Axton 是谁”的变量,并填入我的简介。当用户问及 Axton 是谁时,机器人就能直接给出准确回答。我在预览窗口测试了一下,它准确地输出了我设定的简介:”Axton 是一位在 AI 自动化高效工作流程 Prompts Engineering 等领域具有丰富经验的内容创作者。”
Coze 最近还推出了一个颇具新意数据库(Database)功能,它同样作为知识库的一部分,提供结构化信息。例如,官方示例是存储书籍的名称、章节和笔记。我尝试为我的机器人添加一个名为 urls
的数据库表,用来存放我的常用链接。这个表包含三个字段:name
(名称,字符串类型)、type
(类型,字符串类型) 和 url
(链接,字符串类型)。有趣的是,添加记录并非通过传统界面操作,而是通过自然语言指令。
我尝试用自然语言指示机器人:”在数据库 URLS 当中添加以下三条记录:智图派,博客,[网址A];AI 精英学院,学校,[网址B];回到 Axton,YouTube,[网址C]。” 机器人很快表示添加成功,并且从其操作过程来看,它内部实际执行的是 SQL 语句。我接着问它:”数据库 URLS 当中有哪些记录?” 它准确列出了我刚才添加的三条。它甚至能直接执行我输入的 SQL 查询语句,这对于需要精确数据检索的场景非常高效。例如,当我问”Axton 的博客网址是什么?”它能迅速从数据库中找到并回答 axtonliu.com
。
测试与发布:将 Bot 部署到 Discord
在配置完开场白(Opening dialogue)、自动建议(Auto-suggestion)等内容后,我在预览窗口进行了测试。当我问”Axton 讲过 Code Interpreter 吗?” 它成功搜索知识库并找到了相关视频,给出了标题和链接。当我问”如何让 GPT 为你制作图形笔记?” 它也准确地从我的博客知识库中找到了对应文章《让 GPT 为你制作图形化笔记【智图派】》,并提供了文章链接(尽管我发现这个链接似乎是错误的,但我确实有这篇文章)。
一切就绪后,便可以发布(Publish)机器人了。Coze 海外版支持将机器人发布到多个社交媒体平台,如 Discord、Telegram 等,这些平台大多有手机版,意味着发布的机器人可以在电脑和手机上无缝使用。我演示了将其发布到 Discord 的过程。根据官方文档指引,我在 Discord 创建了一个机器人,获取其 Token,然后在 Coze 的发布页面进行配置,填入 Token,选择要发布的服务器(我选了我的”精英学院”服务器),授予权限,即可完成发布。
发布成功后,我在 Discord 中向机器人提问:”GPT Builder 有什么特点?” 它迅速给出了回答,并注明信息来源于我的一篇 AI 快讯文章《GPT 商店团队版,最懂你的 GPT》,还附上了链接,证明发布成功。
然而,一个奇怪的现象发生了。在 Discord 中查询数据库时,机器人告诉我没有任何数据,尽管在 Coze 平台的预览中数据是存在的。更令人惊讶的是,我尝试通过聊天指令在 Discord 中向这个”空”数据库添加数据,竟然成功了!我还能用指令删除特定记录(例如,把博客类别的记录删除掉
),甚至清空整个表(把这个表都清空了
)。但当我尝试用命令删除数据表本身时,却失败了。这种行为非常有趣,也引人深思:如果其他用户也能通过这种方式随意修改机器人数据库的内容,那将是一个不小的安全隐患。由于海外版文档中尚未提及数据库功能,国内版文档又过于简单,我没有进一步深究具体原因。
实战演练(二):探索多代理(Multi-Agent)机器人的潜力与挑战
多代理机器人提供了独特的交互模式,但目前其配置和行为逻辑尚需官方文档的进一步明确。
接下来,我简单展示一下多代理机器人的情况。我创建了一个包含两个代理(Agent)的测试机器人,不妨称它们为 Tom 和 Jerry。你可以将每个代理理解为一个独立的小型机器人,你与 Tom 的对话内容,Jerry 是不知道的,反之亦然。
Coze 允许在代理之间设置跳转条件(Jump condition)。根据简单的说明,当满足特定条件时,对话会从一个代理跳转到另一个。然而,实际操作起来并不像想象中那么直接,弄清楚跳转条件的具体写法需要花费一些时间,这在有详细文档的情况下本可避免。例如,我设置的条件是:当我输入的内容包含”Jerry”时,对话就从当前代理(比如 Tom)跳转到 Jerry。测试时,当我对 Tom 说”我想找 Jerry”,对话窗口确实切换到了 Jerry。
更有意思的是,如果我将 Tom 和 Jerry 设置成循环连接(例如,Tom 跳转到 Jerry,Jerry 在特定条件下又跳回 Tom),行为会变得有些难以预测。比如我设置当输入包含”老朋友”时,从 Jerry 跳回 Tom。实际测试时,有时会看到它先跳到 Tom,然后迅速又跳回 Jerry,这显示出其内部逻辑可能还不够稳定或清晰。因此,如果想深入使用多代理功能,我建议还是等待官方提供更完善的文档后再进行,以免浪费不必要的时间。
Coze 体验总结:优势、不足与未来展望
Coze 目前最大的优势在于其便捷的 Bot 创建流程以及免费提供的 GPT-4 系列模型,但在高级功能和文档支持方面仍有较大提升空间。
从我的体验来看,Coze 在创建简单的对话机器人方面表现出色,尤其是能够免费使用 GPT-4 和 GPT-4 Turbo,这对广大开发者和 AI 爱好者来说极具吸引力。对于插件功能,如果你熟悉 GPTs 中 Action 的创建,那么在 Coze 中创建自定义插件应该不成问题。
然而,其工作流等高级功能目前尚处于非常早期的阶段,与 Make、Zapier 这类成熟的自动化工具相比,功能和易用性上还有很大差距。Coze 这类产品未来的发展方向也让我好奇:是会更偏向纯 AI 应用的构建,还是会朝着类似 Make、Zapier 这样的自动化平台演进?这可能需要时间来观察。
值得一提的是,Coze 中文版(Coze.cn)在集成国内社交平台方面具有明显优势,目前已支持发布到飞书和微信服务号,这弥补了许多海外自动化工具在这方面的短板。
全局性核心要点总结
回顾整个 Coze 平台的体验,我认为有几个核心要点值得大家关注。首先,Coze 海外版免费提供 GPT-4 Turbo 128K 等先进模型,是其最核心的吸引力。其次,平台对于创建基础的、集成知识库的对话机器人非常友好,上手门槛较低。再者,新兴的数据库功能虽然文档不足,但展示了结构化数据与大模型结合的潜力。然而,高级功能如工作流和多代理模式目前尚不成熟,文档支持也有待完善。最后,Coze 作为一个新兴平台,其发展方向和生态构建值得持续关注。
独特深度洞见
在我看来,Coze 平台目前展现出一种有趣的张力:它一方面极力降低 AI 应用开发的门槛,让普通用户也能快速上手;另一方面,其数据库等功能的底层逻辑(如通过自然语言操作 SQL)以及多代理的复杂交互,又暗示了其向更专业、更强大能力探索的潜力。这种”易用性”与”潜在复杂性”的并存,如果能辅以完善的文档和稳定的功能迭代,或许能开辟出一条独特的 AI 应用构建之路。但同时,如 Discord 中数据库可被轻易修改的现象也提醒我们,在追求功能强大的同时,安全性和权限管理将是平台必须严肃对待的问题。
希望今天的分享能对大家有所帮助。我是 Axton,我们下期再见!