逆天啊!Claude 发布最新版 3.5,AI 会自己用电脑了!| 回到Axton

大家好,我是 Axton。今天我必须和大家分享一个让我惊叹不已的消息——AGI(通用人工智能)的脚步似乎又近了一大步!就在刚刚,Anthropic 公司为其旗舰模型 Claude 推出了一个颠覆性的新功能:直接操作计算机。这不仅仅是一个小更新,它预示着 AI 将如何深度融入并逐步改变我们的工作与生活。站在 2025 年的门槛回望,AI 的进化速度着实惊人,而这项新功能,无疑为我们揭示了 AI 助手未来形态的一角,让我们有机会一窥人类工作模式可能发生的深刻变革。

Claude 3.5 Sonnet 登场:AI 智能体操作电脑的黎明

Anthropic 公司最近发布的一项功能,让 AI 像人类一样操作计算机,这无疑是人工智能领域的一大步。 这项名为”计算机使用模型”(Computer-Using Models)的新能力,目前已在 Claude 3.5 Sonnet(更新至 2025-05)版本中进入公开测试阶段。这意味着,Claude 已经可以根据我们的指令,在电脑屏幕上移动光标、准确点击目标位置,甚至通过键盘输入信息。这几乎完整地模拟了人类与计算机交互的全过程,标志着 AI 从理解语言到执行物理层面操作的跨越。

为什么说这是一个重大突破呢?试想一下,我们日常工作中绝大部分任务都是通过计算机完成的。一个能够真正理解我们的需求,并直接上手操作电脑的 AI 助手,其价值不言而喻。它不再仅仅是提供信息或建议,而是能够成为我们实实在在的”数字之手”,帮助我们处理繁琐的事务,这才是智能助手应有的模样。

AI 操作电脑的背后:多模态与工具使用的融合

这项令人瞩目的新功能,其核心在于 Claude 对多模态能力的深度运用以及先前在工具使用上的积累。 正是因为 AI 具备了多模态理解能力,它才能够”看见”并理解我们计算机屏幕上显示的内容。结合其强大的推理能力,Claude 就能判断出在特定情境下应该如何操作,例如,它会分析屏幕截图,计算出光标需要移动多少像素才能到达正确的按钮或输入框,然后执行点击或输入动作。

这并非一蹴而就。过去 AI 在图像识别、自然语言处理、工具调用等各个方向上的逐步发展,都为今天这一功能的实现奠定了坚实的基础。开发者只需授予 Claude 访问特定软件的权限,它就能像我们一样”看到”屏幕,并基于此进行决策和操作。这不禁让我想起我在 AI 自动化课程中一直强调的观点:AI 与现有应用之间的无缝协作,才能最大化其潜能。

Claude 3.5 的实战表现与自动化工具的未来

尽管 Claude 3.5 在计算机操作方面取得了显著进展,但其目前的能力与人类熟练操作者相比仍有差距,不过其潜力不容小觑。 在一项专门测试模型使用计算机能力的评估中,Claude 3.5 Sonnet(更新至 2025-05)取得了 14.9% 的得分。虽然这远低于人类通常能达到的 70% 到 75% 的水平,但已经显著超越了同类中次优 AI 模型 7.7% 的得分。回顾过去一两年 AI 飞速的迭代,今天看似巨大的差距,或许在不久的将来就能被迅速弥合。

这一进展也对现有的自动化工具生态提出了新的思考。Anthropic 在文档中提到,过去开发者们努力让工具去适应大语言模型,但未来,模型将能更好地适应我们日常使用的工具和计算机环境。这与我一直推崇的 Make.com 这样的自动化平台理念不谋而合。Make 作为一个深层次的集成自动化平台,能够与数千种应用通过 API 进行稳定高效的协作,其价值将日益凸显。

然而,那些依赖模拟人类点击屏幕、录制用户操作来实现自动化的工具,可能将面临严峻的挑战。这类工具的原理更接近于传统的软件自动化测试,其稳定性和灵活性远不如基于 API 的集成。面对 Claude 3.5 这样原生具备计算机操作能力的 AI,它们唯一的出路或许就是尽快拥抱并集成更先进的 AI 技术。

完整视频请点击观看:

局限性与展望:Claude 3.5 通往 AGI 的漫漫征途

当然,目前 Claude 3.5 的这项新功能尚处于公开测试阶段,并非完美无缺,但其发展速度预示着未来的巨大潜力。 例如,一些复杂的操作如拖动、缩放等,Claude 目前可能还无法完美执行。Anthropic 也很坦诚地展示了一些操作出错的演示,这说明技术仍在打磨之中。但正如我们所见证的,AI 的学习和进化速度是指数级的。

这些局限性并不能掩盖其划时代的意义。Claude 3.5 Sonnet(更新至 2025-05)所展示的计算机操作能力,是 AI 从”大脑”向”手脚”延伸的关键一步。它让我们更加具体地感知到,一个能够深度参与我们数字生活的 AI 伙伴,正一步步向我们走来。

全局性核心要点总结

在我看来,Claude 3.5 的这项更新至少揭示了几个核心趋势:首先,AI 的能力边界正在以前所未有的速度扩展,从理解语言到与数字世界进行物理交互,这是一个质的飞跃。其次,真正实用的 AI 助手必须能够无缝融入我们现有的工作流和工具生态,而直接操作计算机是实现这一目标的关键。再次,这也预示着自动化领域可能迎来新的洗牌,基于底层 API 的深度集成将比表层模拟操作更具生命力。最后,尽管当前技术仍有局限,但 AI 惊人的学习和迭代速度让我们有理由相信,更强大的 AI 应用将很快到来。

独特深度洞见

这次 Claude 3.5 的更新,不仅仅是技术上的突破,更像是一块多米诺骨牌,一旦倒下,后续的连锁反应将远超我们的想象。它挑战了我们对”工作”和”工具”的传统认知。未来,我们与 AI 的关系可能不再是简单的主仆或用户与工具,而更像是一种深度协作的伙伴关系。AI 将不仅仅是执行者,更可能是我们能力的延伸,帮助我们突破固有的认知和操作瓶颈,共同探索更广阔的创新空间。这或许就是通往 AGI 道路上,一个具体而微小的,但却至关重要的里程碑。

掌握系统化思维,构建你的AI智能体

工具思维跨越到智能体思维,掌握系统化的方法论与AI智能体构建能力,构建可迁移的AI自动化技能,随时适应新需求!

7 阶实战体系,一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动,效率提升10倍!

◆ 现在订阅,限时享受独家优惠,解锁你的AI竞争优势!



立即开启AI智能体进化之旅 →

Axton二维码

扫码关注获取更多资源

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部