这可能是 2024 年最重要的 AI 突破:深入解析 Claude MCP 协议(完整教程 + 实战) | 回到Axton

MCP 是 AI 助手的视野革命

Claude 开源的 Model Context Protocol(MCP)是一个开创性协议,让 AI 助手能够摆脱”两眼一抹黑”的状态,直接访问用户本地和远程数据。 这个协议允许 AI 与各种数据源建立连接,包括本地文件、Google Drive 文档、Slack 消息、数据库记录等。MCP 的核心价值在于它是开源的,这将加速生态系统的建设,让开发者能够基于统一标准开发更多服务器和客户端。

MCP 采用客户端-服务器架构,Claude 桌面应用作为 MCP Host,同时提供客户端功能并管理服务器。通过标准化的协议,AI 助手可以与各种 MCP 服务器建立连接,这些服务器负责从本地或远程资源获取数据。这种架构设计确保了数据访问的安全性和可控性,用户对每次数据访问都有明确的权限控制。

MCP 的基本工作流程

MCP 的工作流程是通过标准协议连接 AI 与数据源,使 AI 能够自然地访问、分析和操作数据。 当用户启动 Claude Desktop 时,它会加载配置文件中的 MCP 服务器列表,并与这些服务器建立连接。用户请求处理数据时,Claude 会判断哪个 MCP 服务器可以完成任务,查询服务器的能力,然后通过协商过程获取必要的权限和数据。

以 SQLite 服务器为例,当用户要求 Claude 分析数据库内容时,Claude 会先请求访问权限,然后查询数据库结构,生成 SQL 语句获取数据,最后基于这些数据提供分析和建议。整个过程对用户来说是透明的,无需编写任何 SQL 代码,只需使用自然语言表达需求即可。

MCP 服务器生态系统

Claude 官方和社区已经开发了多种 MCP 服务器,覆盖了广泛的应用场景,从文件系统操作到网页自动化。 目前官方提供的服务器包括 Brave Search(网络搜索)、Fetch(网页内容获取)、文件系统(本地文件操作)、Google Drive 集成、Git/GitHub/GitLab(版本控制)、Google Maps、SQLite/PostgreSQL(数据库操作)、Puppeteer(浏览器自动化)等。

在实际测试中,文件系统服务器可以读取和分析本地文件,Fetch 服务器能够获取网页内容并转换为 Markdown 格式,而 Puppeteer 服务器则提供了强大的浏览器自动化能力,包括页面导航、截图、点击元素和填充表单等。这些服务器可以协同工作,为 AI 助手提供全面的数据访问和操作能力。

MCP 的配置与使用

使用 MCP 需要简单配置 Claude Desktop 的 JSON 配置文件,添加所需的服务器及其参数。 配置文件的结构包括服务器名称、执行命令和参数。每个服务器都有特定的命名空间和功能参数,如文件系统服务器需要指定操作目录,SQLite 服务器需要指定数据库路径。

配置完成后,重启 Claude Desktop 即可加载新的 MCP 服务器。用户可以通过自然语言指令让 Claude 使用这些服务器的功能,如查询数据库、分析文件内容、自动化网页操作等。MCP 的设计理念是让用户无需了解底层技术细节,只需表达需求,AI 助手就能自动选择合适的工具完成任务。

核心观点

  • MCP 是一个开源协议,将加速 AI 与数据源互操作的生态系统建设,类似于 ChatGPT 的 GPTs 和 Actions
  • MCP 采用客户端-服务器架构,确保数据访问安全可控,用户对每次数据访问都有明确的权限控制
  • Claude 通过 MCP 可以实现从自然语言到实际操作的无缝转换,让用户无需学习技术细节
  • MCP 服务器可以协同工作,组合多种能力完成复杂任务,为 AI 自动化提供了基础架构
  • 虽然目前 MCP 还处于预览版阶段,功能有限,但其开放性为未来 AI 助手能力的快速扩展奠定了基础

关键洞见

MCP 代表了 AI 工具发展的重要转折点:从封闭的单一应用向开放的协作生态系统转变。通过标准化的协议将 AI 与各类数据源和工具连接起来,MCP 实际上在构建一个”AI 操作系统”的基础架构,让 AI 能够像人类一样感知和操作数字世界。这种架构不仅提高了 AI 的实用性,也为未来更复杂的 AI 代理(Agent)系统铺平了道路,使 AI 能够在理解用户意图的基础上,自主选择和组合工具来完成任务。

请点击观看原始视频:

玩转 Claude Model Context Protocol (MCP):从入门到进阶实操

嘿,你好,欢迎回到 Axton。

Claude 刚刚开源了一个重磅项目,Model Context Protocol,简称 MCP。这个东西有多牛呢?它可以让 AI 助手彻底地摆脱两眼一抹黑的状态。以前咱们让 AI 来使用我们的数据,要么复制粘贴,要么上传下载,就算可以跟其他的 App 进行互操作,支持的 App 也不多,特别麻烦。

现在有了 MCP,AI 就可以直接地访问你的数据了。这些数据包括你的本地文件,Google Drive 的文档,Slack 消息,数据库的记录等等。它甚至还可以像人一样,来实时地去操作你的浏览器。

如果说去年的 AI 明星是 ChatGPT,今年就是 Claude 莫属了。今天我就带你玩转 MCP。除了官方的基础案例,我还会分享几个进阶的玩法。咱们在实操的过程当中,把 MCP 摸个透。如果你对 AI 技术感兴趣,点赞收藏,咱们直接开始。

什么是 Model Context Protocol (MCP)?

今天首先我们来详细地了解一下什么是 MCP,以及它当中涉及到的一些概念到底是什么意思。然后我们进行案例实操,这就包括一个基础案例,然后再来三个进阶的测试案例。在案例的实操过程当中,我们会碰到更多的概念,我们就会进一步地把它们了解清楚。这样我们就可以对 Claude 的 MCP 有一个完整的认识。

好,我们先看看关于 MCP 的三个主要网站。
一个就是 MCP 的官方博客的简介。这篇文章很短,快速阅读一下就对 MCP 整体有一个了解了。不过不读也没关系,我们接下来就会讲到其中的重点。
第二个网站是 Quickstart,这是 MCP 的操作手册,相当于 Quickstart 快速入门。我们所需要的 MCP 的基本命令,在这篇文档里面都有,都很完整。我们就可以把自己的第一个 MCP 给运行起来了。
第三个文档,是 MCP 的官方服务器列表。在这个项目里面,就是 Claude 官方提供的 MCP 的一些服务器,以及社区开发的一些服务器。虽然现在还不多,但是我相信,这个就跟 ChatGPT 的 GPT 是一样,很快就会越来越多了。

首先我们来看什么是 MCP。MCP 就是 Model Context Protocol 的简称,模型上下文协议。它是一个协议,它是用来把 AI 助手跟你的数据存储系统进行连接起来的一个标准。那你的这些数据存储系统,可能就会包括你的数据库,你的 GitHub 的仓库,包括你使用的各种工具,甚至是你的开发环境。连接的目的,就是为了让 AI 能够更好地去访问到你的数据。这样不但能够扩展模型的能力边界,而且在你的数据加持之下,这样的模型生成更相关的响应,也就变得更加可靠。

这个事情的重点是,它的协议进行了开源。那么这样就会很快地把生态能给建设起来。目前 MCP 它还是一个本地的服务,就是它是运行在你的自己的电脑上的。当然不排除将来它会支持远程的服务。

MCP 这边主要的两个概念,就是一个 MCP Server,MCP 的服务器和 MCP 的 Client。整个协议针对开发者来说,有三个主要的组成部分:一个是协议规范,一个是 Claude 桌面 APP 当中的本地的 MCP 服务器的支持,还有就是一个开源 MCP 的服务器库,就是我们刚才看到的服务器的 GitHub 的网址。

这里面提到的数据源和 AI 工具。数据源就是所谓的资源,包括文件、数据库记录、API 响应等等。

在我们介绍完整个 MCP 的概念之后,我们可以来一个测试题,看看是不是了解了 Claude 的 MCP。Claude 的桌面端 APP 到底是 MCP Server 还是 MCP Client?我们不着急现在去回答它。

MCP 是如何工作的?

我们先看一下 MCP 它是怎么样工作的。Claude 官方给出了它的基础架构图,就是这样的一个图。我重新画了一下,增加了一些说明。我们待会就用一个简单的例子来帮助大家理解一下什么是客户端和服务器架构。

我们先来看 Claude 的整体架构怎么样的、怎么运作的。我们首先来看什么是 MCP Host,MCP 主机。MCP 主机它就是像 Claude 的桌面端,集成的开发环境,或者通过 MCP 这个协议来访问资源的一些 AI 的工具。Claude 的桌面应用程序,它的 APP 就同时负责管理 MCP 服务器以及负责提供 MCP 客户端的功能。而 MCP 的客户端,它就会通过 MCP 协议和 MCP 服务器维持一比一的连接,一对一的连接。这是 MCP Host 的概念。

那 MCP 的 Host,从图示上我们就可以看出,它通过 MCP 的协议跟 MCP 的 Server 进行连接。这里面有 MCP 的服务器 A,MCP 服务器 B,MCP 服务器 C。也就是说它在 Host 里面,它实际上是可以跟多个服务器,MCP 服务器进行连接的。因为一个 Host 里面,每一个 Server,它就会可以访问到你本地的资源,也就是你本地的数据,就是我们刚才提到的,就是包括本地的文件,数据库的记录,图片等等。这些就叫做资源。

同样 MCP 的服务器,它也可以上互联网,获得远程的资源。比如 Google 资料的文档,或者 GitHub 你的仓库,这就是远程的资源。同样在 Host 当中的 MCP Client 客户端可以通过 MCP 协议跟 MCP 的服务器进行双向的通讯。MCP 的服务器又可以从本地资源或者远程资源当中的数据进行存取。

那 MCP Server 是什么概念?按它的定义来说,就是通过标准化的模型上下文协议来展示一些特定的功能。其实 MCP 的 Server 我们可以类比为 ChatGPT 的 GPTs。而所谓的 Server 的能力,Capabilities,也就是工具 Tools,我们可以类比为 GPTs 的 Action,也可以理解为 ToolCalling。所以大家你看,这些 AI 厂商,大家看起来好像都是殊途同归,最后就看谁走得更好了。

客户端服务器架构浅析

如果你是非计算机专业,你可能对客户端服务器架构还有点陌生。我们就用一个简单的例子来说明一下什么是客户端服务器架构。了解的同学可以直接跳过这一段。

我们假设,你进入一个饭店吃饭,你是客人,那么你就是客户端。你跟服务员点餐,需要按照一定的规矩来。不同的饭店它可能有不同的规矩。比如珍珠奶茶,你不能说是珍珠奶茶,你要说 QQ 奶茶好喝到没话说。这个规矩,就是协议。服务员相当于是一个传输协议的网线。你点完了菜,我们就可以说,你完成了一次请求。而后厨的大师傅,他就相当于是服务器。他从本地资源里头,抓了一把珍珠,然后混到奶茶里边,再通过服务员把这杯奶茶返回给你。我们就可以说,作为服务器的大厨,完成了一次响应。如果服务员最后把奶茶端给你了,我们就可以说,你成功地收到了服务器返回的应答。你们就成功地完成了一次交互。如果服务员拿着你的奶茶跑路了,你半天没等来,大声地问一句,我奶茶呢?这个就叫做超时重试。这就是整个一个简单的客户服务器结构,它的通讯和运作过程。

这边我是觉得,这个图稍微地改动一点点,可能会更准确一点。因为针对 Claude desktop 这个 app 来说,MCP 的 host,它这一个 host 包括了 MCP 客户端的功能,同时它也提供了 MCP 服务器的功能。所以实际上 MCP 的 host 它是包含客户端和服务器这两部分的。这是我认为需要稍微调整一点的地方。

MCP 的意义与展望

以上就是 MCP 的基本概念以及它的工作过程。MCP 本身它是一个协议。当这个协议开源之后,开发者就可以在这个协议的框架之下开发 MCP 的服务器或者开发 MCP 的客户端。这样就可以使得我们 AI 的应用场景会越来越广。所以我觉得 Claude 推出一个开放协议,这个意义还是挺重大的。

同样它目前也是一个测试版,所以功能并没有太夸张。它的一些案例,用其他的 AI 自动化工具也许会实现得更好。但是这是一个开始,开放的协议会带来 AI 和其他应用系统互操作的快速的发展。我们拭目以待。

MCP 实操案例演练

接下来我们就来看几个实操案例。一方面可以对 MCP 有更进一步的了解,另外一方面,你去用 MCP server 其实非常简单。那么实操之后,你就可以自己去用适合于你自己的工作场景的 server 来搭建出你自己的 MCP 工作流了。好,我们开始。

接下来我们就看几个实操案例,然后在练习的过程当中就可以更深入地去了解 MCP 是怎么运作的。第一个就是一个基础案例,这是 Claude MCP 官方给出的一个例子。我们首先就按照它的官方的步骤来详细地把这个例子走一遍。在这个过程当中,我们就去了解一些相关的细节问题。然后我们再来演示几个进阶的测试案例,这样我们对 MCP 的应用场景就会有更多的感受了。

基础案例:SQLite 数据库操作

好,我们先进入基础案例。基础案例的整个操作步骤在 MCP 的 Quick Start 文档当中都有详细的介绍。我把重点挑出来,放到了我的文档里面,然后对一些其中涉及到的概念做了注释。那么我们就按照我的这个文档,我们来走一遍。

首先是环境准备。需要什么样的先决条件呢?macOS 或者 Windows,最新版本的 Claude Desktop 1.4.18,Git、SQLite。这边给出了几个命令来检查一下你的本机安装了这些包没有。我们来看一下。

这边打开我的 terminal,打开我的一个终端窗口。先看 UV。在 Linux 上面检查一个包有没有安装,经常用就是用它的命令,然后加一个 version 的参数。这样可以一举两得,不但可以看到它有没有安装。UV 没有安装。Git,Git 有。SQLite,也有。那么我们就需要安装 UV。

那 UV 是什么呢?UV 它就是一个 Python 的包以及项目管理工具,Project Manager。MCP 的 server 有两种,一种就是使用 TypeScript 语言的,这种 server 我们一般是用 NPX 去运行它。一类 server 就是 Python 写的,这种 server 我们就是用 UVX 也就是 UV,或者 PIP 来运行。那 Claude 官方推荐的就是用 UV。我们在演示过程当中,咱们就运行 UV 去运行 Python 的 server。我们可以用它的这几个命令把这三个包都给安装上。直接拷贝粘贴到这里来就可以了。

安装完成。然后我们看下一步。Claude 官方这个例子是从 SQLite 数据库里面对数据进行查询和分析。所以我们就需要准备测试数据。SQLite 是一个本地的数据库,简单好用,功能全,所以了解一下它还是很有意义的。那我们准备测试数据,就可以让 Claude 给我们生成一个测试数据。这边我就是让 Claude 给我生成了 20 个在线 AI 课程的一个数据表。

这边我们可以看到 SQLite 3,就是你的数据库的文件名以及它所在的目录。如果你需要让它创建在其他地方,你就给它指定一个路径名。这边我给它换一个文件夹。创建完成之后,我们可以简单地测试一下,看看数据库有没有成功创建。我们直接运行 SQLite 3,然后后面跟上你的数据库的名称,刚才你创建的数据库的名称。然后进来之后,我们直接 select * from 我们的表名 products。OK,这说明我们的数据库创建成功了。

那接下来,我们就要配置 Claude Desktop 了。首先打开咱们 Claude Desktop 的配置文件。Mac 电脑的 Claude Desktop 的配置文件就是它给出的这个路径。我们可以先看一下这个路径里头有没有这个文件。配置文件是 claude-desktop-config.json。在你第一次使用的时候,它是没有这个配置文件的。当然不管它有没有都没关系,我们直接运行命令编辑这个文件,创建一个这个文件。你可以用任何的文本编辑器来打开这个文件。那这边我用的是 Cursor,你可以用任何你熟悉的编辑器,VIM 或者 TextEdit 都可以。好,这边我就直接拷贝,用 Cursor 来做。那这时候就是个空文件,我们只要把下面的这个配置文件给它拷贝进去就行了。

那这个配置文件都什么意思呢?首先就会告诉你,这下面是 MCP Server。这个 MCP Server 的名字呢,叫 Azure Light。然后我要运行什么样的命令呢?就是运行 UAX。那这个 UAX 命令的参数是什么呢?第一个参数就是 MCP Server Azure Light,这就是这个 MCP Server 的名称。然后后面跟的参数是你的数据库的路径,DB Path。我们需要修改的就是这个数据库的路径,用我们刚才创建的数据库的真实路径来替换掉。这边就是我刚才创建的数据库的路径。然后我们保存一下。这样配置文件就完成了。我们只要把 Claude Desktop 的 App 重新重启一下就可以。

Claude 的 App 重启之后呢,我们就会看到在命令窗口的右下角,这边有一个小榔头的图标,它就是你的 MCP 的工具的列表。点击实际上我们就可以看到你现在有哪些 MCP 的工具了。因为现在我只安装了一个 SQLite 的 Server,所以这些所有的工具都是来自于 SQLite 的。OK,我们这边就先进行最简单的一个问题。问他你能连接到 SQLite 的数据库并告诉我有哪些产品可用以及它们的价格吗?

首先就会要求权限,那么我们点击允许。很好,他已经查出了我的 Product 数据库里面的内容,就是各种 AI 课程的内容,模拟数据。当然我的 AI 自动化这不是模拟数据,这是实际的有的课程。

从 Claude 的回答当中呢,我们就可以看到它整个执行 MCP 的过程。首先第一步,就是从数据库中当中去看有多少个表。然后发现有 Product 表之后呢,它来确定这个表的结构是什么,你都有哪些字段。然后再生成一个 SQL 语句去查询这个表当中所有的产品信息,查询这个表当中的所有的记录并且按价格来排序。之后根据它拿到的数据进行总结,给了你一个结果。这就是它一个标准的执行过程。

我们再来看两个进阶的问题吧。你能分析价格分布并提出任何定价优化的建议吗?这些问题其实对 Claude 来说已经是小菜一碟了。它既然能拿到这个数据,所以做这些事情都没有丝毫的问题。居然还把查询写错了,重新来了一把。给出了一些定价优化建议等等,捆绑销售、创建课程包。我现在还真有一个课程包,不错。

我们来看一下它在做什么。首先它这种写法,will result from read query from SQLite。read query 就是 tools,就是工具,就是 SQLite 这个服务器提供的工具。所以它首先调用了 read query 这个工具,给你来点统计运算。然后还是调用 read query 的工具来做这个价格分布区间的查询。最后调用了一个 append insight,这是另外一个工具了。这个工具还是挺有用的,根据你的数据库的数据分析,它会给你给出一些重要的见解。这点确实还是很有用的。

那接下来我们再试最后一个。你能帮我设计并创建一个用于存储客户订单的新的表格吗?这就不光是查询了,我还要写入。很好,不但会创建,还知道创建完之后验证一下有没有成功。OK,这就是创建表格的语句,这个语句没有问题。这个也是创建成功。然后进行了查询,查询表结构,证明创建成功了。那接下来还可以向表插入数据啊,或者等等吧。总之你可以通过 Claude 的 MCP 来对你的数据库进行自然语言的操作,你完全不需要去学 SQL 语句了。

那它的整个工作流程,我们可以来简单总结一下。那首先在 Claude Desktop 一启动的时候,它就会进行去发现你配置了哪些服务器,实际上就是通过那个 JSON 配置文件来的。然后它就会连接到你配置的那些 MCP 服务器。这是它启动的时候干的事情。那当你需要 Claude 来帮你处理数据的时候呢,它就首先会去判断哪一个 MCP 的服务器是可以来完成这个任务的。然后就会去查询这个服务器的能力,你这个服务器有没有能力来完成。这就是它的请求。所以这边就是一个 negotiation 的过程,就是一个协商的过程。然后成功之后呢,就会去从你的本地的 SQLite 这个数据库里面去获取数据了。也就是说从你的本地的 MCP server 里面可以去获取数据了。

那当然 MCP 有很多安全性的考量,这就是我们看到的,不停地来问你权限。那至少让大家可以安心的呢,就是首先它是本地的,然后把这个数据暴露到 Internet 网上,然后都是需要用户来确认的。所以这就是 Claude 在它的文档当中所说的,它是一个可控安全的一个环境。

进阶测试案例

好,接下来我们演示几个进阶的测试案例。这些测试案例就来自于 MCP 的官方 servers 里面列举的这些所有的这些 servers。这些网址大家不用记,回头我会放在描述栏当中,所有的内容都会在描述栏当中。

那目前官方提供的 server 一共提供了 16 个服务器。这就包括 Brave Search,它可以用 Brave API 进行网络搜索。然后 Everything 是一个演示展示一下 MCP 的功能。Fetch 就是获取网页的功能,可以把网页内容拿过来转换成 Markdown。然后文件系统,它可以操作本地的文件系统,读写文件啊,目录管理等等。还有跟谷歌 Drive 的集成。然后跟 Git 和 GitHub,这就是你的开发仓库的版本控制的管理。还有 GitLab,这些都是类似。同样跟谷歌地图。然后还有本地的知识图谱。还有 PostgreSQL,这也是个数据库,相比 SQLite 来说,它就是一个大型的数据库了,跟 MySQL 是类似的级别的。然后还有一个 Popkey,这也是一个非常有用的工具,它有很多很大的功能,可以去打开页面啊,点击页面啊,甚至给你的页面截图等等。然后 Sentry 一般都是 app 的问题报告。Slack 通讯工具。SQLite 这个我们已经测试过了。然后 time 时间和时区转换。好,这就是它目前官方的 server 的一个列表。这个网址我也会放到描述栏当中。那以后有新的更新呢,我们也会挑选有用的 server 来 update 一下。

文件系统操作测试

好,我们首先测试的就是这个文件系统。那同样它这边已经给出了一个现成的配置,我们只要把它拷贝粘贴到咱们那个 JSON 的配置文件里面去就可以了。注意 JSON 文件如果有多个服务器的话,那前面这些最后结尾是有一个逗号的。

那通过文件系统的这个配置参数呢,我们刚好可以来看一下 MCP 它的配置文件一个大概的结构。首先我们看到的就是命令,这就是用来执行的命令。那这个我们前面看到过。那后面就是给执行命令的参数。减号 y 就表示自动确认所有的提示,跳过确认步骤。因为有些命令在执行的时候会询问你一些问题,那减号 y 呢就表示我每一个问题我都答是。那然后这一个呢,这个参数的配置呢,首先我们看前面这一块。那这一部分它是指定要运行的 MCP 文件系统的服务器的包在哪里。前半部分 at 的这个部分呢,它是 Claude 官方的命名空间。然后 server filesystem 就是这个文件系统的服务器的包。那在下面跟的就是我的文件系统的目录了,我让它来操作我本地的哪一个目录,这个参数就跟在这。那这边的命名空间呢,你就需要完全按照 Claude 官方的命名空间来做,这块不能错。如果是你自己开发的,那么就用你自己的命名空间来替换。OK。

然后保存。同样我们需要把 Claude 关闭,然后重启一下。重新启动 Claude 之后呢,我们就可以看到这边变成 15 个了,原来是 6 个。那就多了很多本地文件系统的工具。刚才我们的配置文件写的时候,有一个小错误。我第一次把这个 filesystem 给放到 MCP server 的外头了,应该放在它的里边,MCP server 的大括号里边。这里面是所有的服务的列表。

好,那么下面我们就来测试几个本地文件系统的功能。主要就是测试文件的读取以及分析。这是我的本地文件目录,这里面主要有两个 CSV 文件。一个是有 2000 行记录的 BTC 的数据,另外一个是 600 万行记录的 BTC 数据。2000 行的这个是 191KB 的大小,600 万行的这个是 348MB。

好,我们来看一下对文件系统的读取。首先我们让它列举一下我本地系统都有多少 CSV 文件。好,找到了三个 CSV 文件,文件都没有问题。然后它还主动地去查看文件的信息。2000 行的这个 BTC 大约 190KB,600 万行这个大约 348MB。好,需要我查看这些文件中的具体内容吗?

我们首先让它根据 2000 行的这个 BTC 汇集一个简单的分析图表。OK,这是图表。图表有点问题,咱们先不管它。它好像并没有从我的 CSV 文件里面获取数据。读取文件的这部分是没有问题的,文件应该也全读了过来。看到最后,OK,它切掉了 10 万个字符,它只取 10 万个字符。好,咱们就不去纠结它的字数问题了。这边测试是它读取数据,数据没有问题。

我们再让它试一下那个 600 万行的 CSV。那它很有可能也是只拿了 10 万个字符过来。它一直在读取这个文件。OK,出错了。好,没有办法直接读取全部的内容。它改用 SQL 来做了。AI 就是聪明,改用 SQL 来做。OK,这不如说写 query。等一下我们去看一下。无法访问完整的 CSV 文件,使用了模拟数据。模拟数据不是逗我玩吗?

我们来看一下它调用工具的过程。首先读文件的时候它是出错了,抛出错误,服务员端着奶茶跑路了。然后它尝试去调用了 SQLite 的工具。我看它在干什么。创建了一个表,BTC 的表。表格的结构它应该是按照 CSV 文件来的。然后创建了表。我们现在把这个表清空。再然后呢,把 CSV 文件导入到这个表里面去。这个做法还是很聪明的。但是它这边出现语法错误了。那很自然,下面的查询语句就不会出现结果。

我们可以让它把这一部分修改掉。不支持直接的 CSV 文件导入。好,现在开始让我给它提建议,怎么处理这个文件了。看它会想什么办法来做。它搞不定就用模拟数据。我们再来让它尝试一下,看能不能把 CSV 文件导入到 SQLite 数据库里面。OK,它搞不定导入。我们看一下我们自己能不能导入。OK,它是可以导入的。咱们就别让它导入太多了。好,已经导入了一堆了。我们看一下多少条记录导入了。个十百千万十万百万,居然已经导入了三百多万条记录了。真的吗?这么快?好奇怪。今天它就跟模拟数据杠上了。

OK,咱们就先不跟它去折腾分析图表的事情了。至少它对本地文件系统的操作是没有问题的。

Fetch 功能测试:获取网页内容

好,接下来我们测试下一项。我们先把 Claude 推出。每次修改配置文件,它都需要重新启动 Claude 客户端。好,下一个就是 Fetch。这也是个很有用的功能,可以把网页的内容获取回来,然后还转换成 Markdown 格式。同样我们按照它的配置要求进行配置。这边建议你安装 Node.js,这会让它运行得更有效。那我的 Node 实际上是有的。好,我这边是已经装过 Node 了。如果没有装过,就用这个命令进行安装就可以。

同样我们需要去配置 Claude 的这个 app。一样,我们把这个拷贝过来,再到我们的配置文件里头,把它粘贴到我们的配置文件里。因为我们的配置文件里头已经有两个 server 了,所以我们在需要新的配置的时候,我们不需要前面那个 mcp server 的这部分,我们只需要这个服务器的部分就行了。所以这边我们只需要 Fetch 的部分。同样记得把上面加个逗号。保存,格式化一下。OK,我们再重启 Claude。增加了一个 Fetch。

好,我们接下来让它获取一个 URL 的内容进行简要总结。这个 URL 就是我的一篇博文。请获取 URL 的内容进行简要总结。OK,没有问题,notebook.lm。所以获取网页内容是没有任何问题,丝滑地就完成了。

Puppeteer 功能测试:浏览器自动化

然后我们再试一下这个可以当作自动化工具来用的 Puppeteer。它提供浏览器的自动化功能。它可用的工具很多:页面导航,页面截图,然后点击页面当中的元素,悬停元素,填充表单,还能填充表单,选择下拉框,以及执行 JavaScript 的脚本。所以这个功能还是比较多,应该还是挺有实用价值的。

同样我们按照说明进行配置。其实我们看到的配置内容都很简单,基本上它的配置都是同样的模式。我们把这部分拷贝过来,然后继续粘贴到我们的配置文件里。不要忘了逗号。保存,格式化一下。好,配置文件完成,我们再把 Claude 启动起来。好,等了有一阵以后,这边就加载成功了,21 个了已经。我们到这边新增加的 Puppeteer 的。OK。

我们可以尝试一下 Puppeteer 了。我们先尝试第一步,直接让它打开我的 AI 精英学院的首页。OK,直接调用了我的 Chrome 浏览器,打开了我的首页。但是是在一个小的 frame 里面,它是在一个 frame 里面打开的我的主页。没有问题,打开的都没有问题。已经可以开始操作其他的 app。

好,我们看它这边干啥了。首先使用的 Puppeteer 的 Navigate 打开了我的网页,然后截取了一张网页截图。它倒挺主动。好,我们先把这个关掉。然后我们直接再测试一下,一次给它三个任务。我们可以重新开一个新的会话。一次给它三个任务:打开首页,然后点击按钮,点击查看热销套装详情这个按钮。我们先看一下,直接让它点击这个按钮的名称,看看它能不能点。我们先测试一下,告诉它按钮的名称,看它能不能点到。

好,导航到网页。OK,直接用名字,它没有成功。然后它尝试截图,看看它能不能成功。尝试截取整个页面,这样可以确保我们至少得到一个截图。Claude 也变得越来越会凑合事儿了。重新尝试。从它的命令上看,它应该不会尝试成功吧。还挺厉害,居然开始要执行脚本了。不错,点了一个按钮,但是点的不是热销套装的按钮,打开了我的 AI 实战派的按钮。然后它会认为成功了。不错,点了一个按钮,虽然没点对。这是因为它自己找到了一个按钮的标识,然后就点了一下。虽然按钮没有点对,但是这个结果已经很不错了。

接下来尝试就给它一个明确的 selector,看它会不会做得更好。我们先把这个页面关掉。好,这时候我就给它一个详细的命令。这个按钮呢,就给它了 selector。这是这个按钮的 selector。看看这次行不行。很好,再继续。好,这下就点对了。因为给了它正确的 selector,所以它的按钮就点的正确了。好,又点了一次。好,再来截图。中文来一遍,英文来一遍。双语完成任务。

好,很好,已经很不错了。这样,MCP 它通过多个服务器之间协同,确实是已经具备了基本的自动化的能力。当然,MCP 目前还只是一个预览版,它相对真正的那些自动化工作流的平台还是弱很多。但是这一两年的 AI 的趋势已经很明显了,它一旦开始,它的发展的速度真是会超乎我们的想象。看接下来 AI agent 该怎么走吧,大家各有各的招。

掌握系统化思维,构建你的AI智能体

工具思维跨越到智能体思维,掌握系统化的方法论与AI智能体构建能力,构建可迁移的AI自动化技能,随时适应新需求!

7 阶实战体系,一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动,效率提升10倍!

◆ 现在订阅,限时享受独家优惠,解锁你的AI竞争优势!



立即开启AI智能体进化之旅 →

Axton二维码

扫码关注获取更多资源

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部