逆天啊！Claude 发布最新版 3.5，AI 会自己用电脑了！| 回到Axton

大家好，我是 Axton。今天我必须和大家分享一个让我惊叹不已的消息——AGI（通用人工智能）的脚步似乎又近了一大步！就在刚刚，Anthropic 公司为其旗舰模型 Claude 推出了一个颠覆性的新功能：直接操作计算机。这不仅仅是一个小更新，它预示着 AI 将如何深度融入并逐步改变我们的工作与生活。站在 2025 年的门槛回望，AI 的进化速度着实惊人，而这项新功能，无疑为我们揭示了 AI 助手未来形态的一角，让我们有机会一窥人类工作模式可能发生的深刻变革。

Claude 3.5 Sonnet 登场：AI 智能体操作电脑的黎明

Anthropic 公司最近发布的一项功能，让 AI 像人类一样操作计算机，这无疑是人工智能领域的一大步。 这项名为”计算机使用模型”（Computer-Using Models）的新能力，目前已在 Claude 3.5 Sonnet（更新至 2025-05）版本中进入公开测试阶段。这意味着，Claude 已经可以根据我们的指令，在电脑屏幕上移动光标、准确点击目标位置，甚至通过键盘输入信息。这几乎完整地模拟了人类与计算机交互的全过程，标志着 AI 从理解语言到执行物理层面操作的跨越。

为什么说这是一个重大突破呢？试想一下，我们日常工作中绝大部分任务都是通过计算机完成的。一个能够真正理解我们的需求，并直接上手操作电脑的 AI 助手，其价值不言而喻。它不再仅仅是提供信息或建议，而是能够成为我们实实在在的”数字之手”，帮助我们处理繁琐的事务，这才是智能助手应有的模样。

AI 操作电脑的背后：多模态与工具使用的融合

这项令人瞩目的新功能，其核心在于 Claude 对多模态能力的深度运用以及先前在工具使用上的积累。 正是因为 AI 具备了多模态理解能力，它才能够”看见”并理解我们计算机屏幕上显示的内容。结合其强大的推理能力，Claude 就能判断出在特定情境下应该如何操作，例如，它会分析屏幕截图，计算出光标需要移动多少像素才能到达正确的按钮或输入框，然后执行点击或输入动作。

这并非一蹴而就。过去 AI 在图像识别、自然语言处理、工具调用等各个方向上的逐步发展，都为今天这一功能的实现奠定了坚实的基础。开发者只需授予 Claude 访问特定软件的权限，它就能像我们一样”看到”屏幕，并基于此进行决策和操作。这不禁让我想起我在 AI 自动化课程中一直强调的观点：AI 与现有应用之间的无缝协作，才能最大化其潜能。

Claude 3.5 的实战表现与自动化工具的未来

尽管 Claude 3.5 在计算机操作方面取得了显著进展，但其目前的能力与人类熟练操作者相比仍有差距，不过其潜力不容小觑。 在一项专门测试模型使用计算机能力的评估中，Claude 3.5 Sonnet（更新至 2025-05）取得了 14.9% 的得分。虽然这远低于人类通常能达到的 70% 到 75% 的水平，但已经显著超越了同类中次优 AI 模型 7.7% 的得分。回顾过去一两年 AI 飞速的迭代，今天看似巨大的差距，或许在不久的将来就能被迅速弥合。

这一进展也对现有的自动化工具生态提出了新的思考。Anthropic 在文档中提到，过去开发者们努力让工具去适应大语言模型，但未来，模型将能更好地适应我们日常使用的工具和计算机环境。这与我一直推崇的 Make.com 这样的自动化平台理念不谋而合。Make 作为一个深层次的集成自动化平台，能够与数千种应用通过 API 进行稳定高效的协作，其价值将日益凸显。

然而，那些依赖模拟人类点击屏幕、录制用户操作来实现自动化的工具，可能将面临严峻的挑战。这类工具的原理更接近于传统的软件自动化测试，其稳定性和灵活性远不如基于 API 的集成。面对 Claude 3.5 这样原生具备计算机操作能力的 AI，它们唯一的出路或许就是尽快拥抱并集成更先进的 AI 技术。

完整视频请点击观看：

局限性与展望：Claude 3.5 通往 AGI 的漫漫征途

当然，目前 Claude 3.5 的这项新功能尚处于公开测试阶段，并非完美无缺，但其发展速度预示着未来的巨大潜力。 例如，一些复杂的操作如拖动、缩放等，Claude 目前可能还无法完美执行。Anthropic 也很坦诚地展示了一些操作出错的演示，这说明技术仍在打磨之中。但正如我们所见证的，AI 的学习和进化速度是指数级的。

这些局限性并不能掩盖其划时代的意义。Claude 3.5 Sonnet（更新至 2025-05）所展示的计算机操作能力，是 AI 从”大脑”向”手脚”延伸的关键一步。它让我们更加具体地感知到，一个能够深度参与我们数字生活的 AI 伙伴，正一步步向我们走来。

全局性核心要点总结

在我看来，Claude 3.5 的这项更新至少揭示了几个核心趋势：首先，AI 的能力边界正在以前所未有的速度扩展，从理解语言到与数字世界进行物理交互，这是一个质的飞跃。其次，真正实用的 AI 助手必须能够无缝融入我们现有的工作流和工具生态，而直接操作计算机是实现这一目标的关键。再次，这也预示着自动化领域可能迎来新的洗牌，基于底层 API 的深度集成将比表层模拟操作更具生命力。最后，尽管当前技术仍有局限，但 AI 惊人的学习和迭代速度让我们有理由相信，更强大的 AI 应用将很快到来。

独特深度洞见

这次 Claude 3.5 的更新，不仅仅是技术上的突破，更像是一块多米诺骨牌，一旦倒下，后续的连锁反应将远超我们的想象。它挑战了我们对”工作”和”工具”的传统认知。未来，我们与 AI 的关系可能不再是简单的主仆或用户与工具，而更像是一种深度协作的伙伴关系。AI 将不仅仅是执行者，更可能是我们能力的延伸，帮助我们突破固有的认知和操作瓶颈，共同探索更广阔的创新空间。这或许就是通往 AGI 道路上，一个具体而微小的，但却至关重要的里程碑。

掌握系统化思维，构建你的AI智能体

从工具思维跨越到智能体思维，掌握系统化的方法论与AI智能体构建能力，构建可迁移的AI自动化技能，随时适应新需求！

◆ 7 阶实战体系，一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动，效率提升10倍！

◆ 现在订阅，限时享受独家优惠，解锁你的AI竞争优势！

立即开启AI智能体进化之旅 →

扫码关注获取更多资源