Google Bard 最强更新冲击 GPT-4 ？新版全面对比 | 回到Axton

大家好，我是 Axton。AI 聊天机器人的江湖可谓风起云涌，就在 ChatGPT 的强劲对手 Claude 2 刚刚崭露头角不久，谷歌便携其 Bard 的重磅更新（更新至 2025-05）高调入场，再加上 Meta 的 Llama 系列，大有群雄逐鹿中原之势。继上期我们细致对比了 ChatGPT 与 Claude 2 之后，今天，我将把目光投向最新版的 Google Bard，与当前标杆 GPT-4 进行一番深入的较量。让我们一同探寻，这次 Google Bard 更新究竟带来了哪些令人期待的”黑科技”。

Google Bard 更新：新功能概览与初步印象

这次 Google Bard 更新（更新至 2025-05）带来了不少引人注目的新功能，其中多语言支持和图像识别能力的加入尤为关键。 访问 Bard 的官方网站 Bard.google.com，虽然目前仍存在一定的地区访问限制，但相比 Claude 2，其门槛已有所降低，相信这对于经验丰富的国内用户而言并非难事。关于注册登录的细节，我之前的视频已有提及，这里便不再赘述。

根据 Bard 更新列表（最近更新日期为 7 月 13 日），最核心的改进有两点：其一是 Bard 现已支持更多区域和语言，对我们而言，最重要的莫过于它终于拥抱了中文，因此今天的测试我将主要使用中文进行；其二是谷歌将其强大的 Google Lens 图像识别技术集成到了 Bard 之中，赋予了 Bard 处理和理解图像的能力。不过需要注意的是，Google Lens 的相关功能目前提示仅支持英文输入。此外，Bard 还新增了朗读回应（文本转语音）、置顶和最近帖子（方便管理对话）、分享对话、修改回答（如调整长度、风格，但似乎仅限英文）以及 Python 代码导出至 Replit 等功能。这些功能更多是提升了使用的便捷性，而真正的亮点无疑是多语言与图像处理。

图像识别能力大比拼：Bard Lens vs. GPT-4 (概念)

Bard 集成 Google Lens 后的图像处理能力，在某些场景下展现了超越 GPT-4 概念演示的潜力，但也暴露出一些理解上的不足。 既然 GPT-4 的多模态功能尚未正式对公众开放，我们只能将其与 GPT-4 发布时公布的演示效果进行一番”云对比”。

我首先上传了一张在 GPT-4 发布时用作演示的食材图片——包含面粉、鸡蛋和牛奶，并用中文提问：”我可以用这些食材做什么？” Bard 回应说无法帮助我。这印证了之前提到的，图像相关的 prompt 目前需要使用英文。当我切换到英文提示后，Bard 的表现令人惊喜。它不仅识别出了面粉、鸡蛋和牛奶，还列出了一系列可以制作的菜肴，如煎饼、华夫饼、法式吐司、煎蛋卷、舒芙蕾和面包，并且为每道菜都配上了图片！这个图文并茂的呈现方式，在视觉效果上显然比 GPT-4 当时演示的纯文字回答要生动得多。

接着，我测试了另一张 GPT-4 演示过的图片：一串气球，问题是”如果把绳子剪断了，那么会发生什么？” Bard 的第一个回答有些奇怪，它说”如果线被剪断，气球就会塌陷”，理由是内部空气逸出导致压力降低。但它的第二个草稿回答则非常有趣且细致：”你发来的图片显示了一串五颜六色的气球飞过一条道路。如果线被剪断，气球很可能会随风飘走，甚至可能会撞到什么东西而爆破。这将是一幅美丽的景象，但也会造成一些混乱。” 更有意思的是，它还考虑了气球内气体的种类，比如如果填充的是氦气，气球会上升；如果是二氧化碳（虽然这个假设本身有点问题，因为二氧化碳比空气重，即便有绳子也难以上升），则会掉落。总体而言，Bard 对此问题的解读比 GPT-4 演示中的一句话答案要丰富许多。

然而，在测试一张询问”这个图片有哪些好玩的地方？”的幽默图片时（图片内容是一个人用 VGA 线给手机充电），Bard 的表现就不尽如人意了。它识别出有人试图用 VGA 线给手机充电，并描述了人物的困惑表情，但似乎并没有完全 get 到图片中那种将过时、庞大的 VGA 接口与现代、小巧的手机充电口错误连接所产生的荒谬感和幽默感。相比之下，GPT-4 在其演示中准确指出了这种”荒谬的并置”是笑点所在。当然，这可能也与我上传图片的清晰度有关，不能完全归咎于 Bard 的能力。

从草图到网站：Google Bard 更新后的代码生成初体验

最让我期待的测试之一，便是复现 GPT-4 发布会上那个令人惊艳的手绘草图生成网页代码的场景，Bard 在此也小试牛刀。 当时 OpenAI 的 CEO Greg Brockman 先生展示了 GPT-4 如何根据一张简单的手绘网页草图直接生成相应的 HTML 和 JavaScript 代码。我尝试着手绘了一个类似的界面，包含一个标题”My Joke Website”和两个笑话占位符，然后将图片上传给 Bard，并使用了与 GPT-4 演示时相似的 prompt：”写一个简单的 HTML 或者 JS，把这个图片草稿转换成一个网站，然后这里面的笑话要替换成两个真实的笑话。”

Bard 很快便生成了代码，并附带了详细的解释，告诉我如何编辑笑话内容，保存 HTML 文件并在浏览器中打开。它还说明了网站的交互逻辑：”默认情况下笑话结尾将被隐藏，当你点击一个笑话时结尾将揭示出来。” 我将代码复制粘贴到一个 HTML 文件中并在浏览器中打开。网页的标题”My Joke Website”和两个笑话占位符（它用 “Joke 1” 和 “Pronounced fish, get it?” 填充）都正确显示了。Bard 对代码功能的描述完全符合预期，但实际生成的网页在点击笑话时并没有反应，说明其生成的 JavaScript 代码可能存在一些问题。尽管如此，AI 能根据草图生成网站代码这项能力本身已经足够令人印象深刻，其未来的应用潜力值得期待。

完整视频请点击观看：

代码与逻辑：Bard 在编程和推理任务中的表现

除了图像和网页生成，Bard 在处理更传统的编程任务和逻辑推理问题时，表现则有所起伏。 我之前在 Bard 刚推出时曾做过一期对比视频，那时它还声称自己不会编程。这次，我给它布置了一个具体的 Python 编程任务：读取一个文本文件（我的视频逐字稿），删除所有空行，然后根据逗号、句号等标点符号将长句拆分成多行，并确保每行字符数不超过 17 个，且行尾是完整的单词，最后将结果写入新的文本文件。这个任务的目的是将文字稿处理成适合制作字幕的格式。

Bard 迅速生成了 Python 代码，并附带了清晰的注释。我将代码保存并准备了一个 input.txt 文件进行测试。代码顺利运行，没有报错，并生成了 output.txt 文件。然而，令人遗憾的是，输出文件的内容与输入文件几乎没有变化，并未按要求进行处理。作为对比，我将同样的 prompt 交给了 GPT-4（默认模型），它生成的 Python 脚本则完美地完成了任务。

接下来是经典的逻辑推理题。我先问了那个”树上有九只鸟，猎人开枪打死一只，请问树上还剩下几只？”的问题。Bard 的回答颇具”脑洞”：”树上还有九只。猎人开枪打死了一只，但这只鸟已经从树上掉下来了，所以树上还剩下九只鸟。” 这个思路确实清奇！在另一次尝试中，它回答”剩下八只，因为枪声会吓跑其他的鸟”，也算合理。当我追问如果是无声手枪或弓箭呢？它的回答也相应调整，逻辑基本通顺。

然而，在另一个更复杂的会议时间安排推理题面前（安德鲁 Andrew、乔安尼 Joanne 和海纳 Hina 各自的空闲时间段，找出他们可以共同参加一个 30 分钟会议的所有可能开始时间），Bard 给出的答案是错误的，其表现基本与 GPT-3.5 的水平相当，未能展现出 GPT-4 在此类问题上的强大推理能力。

易用性与辅助功能：Bard 的贴心小改进

除了核心功能，Bard 也带来了一些提升用户体验的辅助功能，尽管部分功能目前尚有语言限制。 我尝试让 Bard 描绘一个关于自己的抽象形象，它回答道：”如果我要在脑海中画出一个关于自己的抽象形象，那会是一个不断学习和成长的图像……不断寻找新方法来帮助他人的图像。”这个回答颇具诗意。

Bard 新增的文本转语音功能，可以通过点击回答右上角的喇叭按钮来朗读内容。我试听了一下，语音效果只能说比较一般。置顶对话功能则很实用，可以将重要的或常用的对话固定在列表顶部，方便快速访问。至于修改回答的功能（如让回答更长、更短、更专业或更随意），我发现在中文界面下似乎并未提供这个选项，但在英文提问后，回答框下方确实出现了修改按钮，点击后可以选择不同的风格。

全局性核心要点总结

通过这次深度体验，我对 Google Bard 的最新更新（更新至 2025-05）有了更全面的认识。首先，多语言支持特别是中文的加入，极大地拓展了其用户群体。其次，集成的 Google Lens 赋予了 Bard 处理图像的能力，虽然目前 prompts 仍需英文且理解准确性有待提升，但其图文并茂的输出形式在某些场景下颇具吸引力。再者，Bard 的代码生成能力已初步显现，尽管在复杂任务和准确性上与 GPT-4 尚有差距。最后，在逻辑推理方面，Bard 目前的表现更接近 GPT-3.5 的水平，而一些便捷性功能如修改回答风格则暂时对非英文用户不够友好。

独特深度洞见

Bard 在这次更新中展现出的最大特点，或许并非单一功能的极致强大，而是其快速迭代的决心和在交互体验上尝试差异化的努力。它在图像解读和某些开放性问题上时而展现的”清奇思路”，虽然不一定总是”正确答案”，但也为我们揭示了大型语言模型在”创造性”或”个性化”表达上的另一种可能性。谷歌显然正在加速追赶，并试图在激烈的 AI 竞争中找到自己独特的生态位。

更多细节可参考我的上一篇文章 👉 谷歌 AI 总动员：IO 2025 精华速览，他们是认真的 | AI 快讯 20250521

掌握系统化思维，构建你的AI智能体

从工具思维跨越到智能体思维，掌握系统化的方法论与AI智能体构建能力，构建可迁移的AI自动化技能，随时适应新需求！

◆ 7 阶实战体系，一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动，效率提升10倍！

◆ 现在订阅，限时享受独家优惠，解锁你的AI竞争优势！

立即开启AI智能体进化之旅 →

扫码关注获取更多资源