大家好,我是 Axton。AI 聊天机器人的江湖可谓风起云涌,就在 ChatGPT 的强劲对手 Claude 2 刚刚崭露头角不久,谷歌便携其 Bard 的重磅更新(更新至 2025-05)高调入场,再加上 Meta 的 Llama 系列,大有群雄逐鹿中原之势。继上期我们细致对比了 ChatGPT 与 Claude 2 之后,今天,我将把目光投向最新版的 Google Bard,与当前标杆 GPT-4 进行一番深入的较量。让我们一同探寻,这次 Google Bard 更新究竟带来了哪些令人期待的”黑科技”。
Google Bard 更新:新功能概览与初步印象
这次 Google Bard 更新(更新至 2025-05)带来了不少引人注目的新功能,其中多语言支持和图像识别能力的加入尤为关键。 访问 Bard 的官方网站 Bard.google.com
,虽然目前仍存在一定的地区访问限制,但相比 Claude 2,其门槛已有所降低,相信这对于经验丰富的国内用户而言并非难事。关于注册登录的细节,我之前的视频已有提及,这里便不再赘述。
根据 Bard 更新列表(最近更新日期为 7 月 13 日),最核心的改进有两点:其一是 Bard 现已支持更多区域和语言,对我们而言,最重要的莫过于它终于拥抱了中文,因此今天的测试我将主要使用中文进行;其二是谷歌将其强大的 Google Lens 图像识别技术集成到了 Bard 之中,赋予了 Bard 处理和理解图像的能力。不过需要注意的是,Google Lens 的相关功能目前提示仅支持英文输入。此外,Bard 还新增了朗读回应(文本转语音)、置顶和最近帖子(方便管理对话)、分享对话、修改回答(如调整长度、风格,但似乎仅限英文)以及 Python 代码导出至 Replit 等功能。这些功能更多是提升了使用的便捷性,而真正的亮点无疑是多语言与图像处理。
图像识别能力大比拼:Bard Lens vs. GPT-4 (概念)
Bard 集成 Google Lens 后的图像处理能力,在某些场景下展现了超越 GPT-4 概念演示的潜力,但也暴露出一些理解上的不足。 既然 GPT-4 的多模态功能尚未正式对公众开放,我们只能将其与 GPT-4 发布时公布的演示效果进行一番”云对比”。
我首先上传了一张在 GPT-4 发布时用作演示的食材图片——包含面粉、鸡蛋和牛奶,并用中文提问:”我可以用这些食材做什么?” Bard 回应说无法帮助我。这印证了之前提到的,图像相关的 prompt 目前需要使用英文。当我切换到英文提示后,Bard 的表现令人惊喜。它不仅识别出了面粉、鸡蛋和牛奶,还列出了一系列可以制作的菜肴,如煎饼、华夫饼、法式吐司、煎蛋卷、舒芙蕾和面包,并且为每道菜都配上了图片!这个图文并茂的呈现方式,在视觉效果上显然比 GPT-4 当时演示的纯文字回答要生动得多。
接着,我测试了另一张 GPT-4 演示过的图片:一串气球,问题是”如果把绳子剪断了,那么会发生什么?” Bard 的第一个回答有些奇怪,它说”如果线被剪断,气球就会塌陷”,理由是内部空气逸出导致压力降低。但它的第二个草稿回答则非常有趣且细致:”你发来的图片显示了一串五颜六色的气球飞过一条道路。如果线被剪断,气球很可能会随风飘走,甚至可能会撞到什么东西而爆破。这将是一幅美丽的景象,但也会造成一些混乱。” 更有意思的是,它还考虑了气球内气体的种类,比如如果填充的是氦气,气球会上升;如果是二氧化碳(虽然这个假设本身有点问题,因为二氧化碳比空气重,即便有绳子也难以上升),则会掉落。总体而言,Bard 对此问题的解读比 GPT-4 演示中的一句话答案要丰富许多。
然而,在测试一张询问”这个图片有哪些好玩的地方?”的幽默图片时(图片内容是一个人用 VGA 线给手机充电),Bard 的表现就不尽如人意了。它识别出有人试图用 VGA 线给手机充电,并描述了人物的困惑表情,但似乎并没有完全 get 到图片中那种将过时、庞大的 VGA 接口与现代、小巧的手机充电口错误连接所产生的荒谬感和幽默感。相比之下,GPT-4 在其演示中准确指出了这种”荒谬的并置”是笑点所在。当然,这可能也与我上传图片的清晰度有关,不能完全归咎于 Bard 的能力。
从草图到网站:Google Bard 更新后的代码生成初体验
最让我期待的测试之一,便是复现 GPT-4 发布会上那个令人惊艳的手绘草图生成网页代码的场景,Bard 在此也小试牛刀。 当时 OpenAI 的 CEO Greg Brockman 先生展示了 GPT-4 如何根据一张简单的手绘网页草图直接生成相应的 HTML 和 JavaScript 代码。我尝试着手绘了一个类似的界面,包含一个标题”My Joke Website”和两个笑话占位符,然后将图片上传给 Bard,并使用了与 GPT-4 演示时相似的 prompt:”写一个简单的 HTML 或者 JS,把这个图片草稿转换成一个网站,然后这里面的笑话要替换成两个真实的笑话。”
Bard 很快便生成了代码,并附带了详细的解释,告诉我如何编辑笑话内容,保存 HTML 文件并在浏览器中打开。它还说明了网站的交互逻辑:”默认情况下笑话结尾将被隐藏,当你点击一个笑话时结尾将揭示出来。” 我将代码复制粘贴到一个 HTML 文件中并在浏览器中打开。网页的标题”My Joke Website”和两个笑话占位符(它用 “Joke 1” 和 “Pronounced fish, get it?” 填充)都正确显示了。Bard 对代码功能的描述完全符合预期,但实际生成的网页在点击笑话时并没有反应,说明其生成的 JavaScript 代码可能存在一些问题。尽管如此,AI 能根据草图生成网站代码这项能力本身已经足够令人印象深刻,其未来的应用潜力值得期待。
完整视频请点击观看:
代码与逻辑:Bard 在编程和推理任务中的表现
除了图像和网页生成,Bard 在处理更传统的编程任务和逻辑推理问题时,表现则有所起伏。 我之前在 Bard 刚推出时曾做过一期对比视频,那时它还声称自己不会编程。这次,我给它布置了一个具体的 Python 编程任务:读取一个文本文件(我的视频逐字稿),删除所有空行,然后根据逗号、句号等标点符号将长句拆分成多行,并确保每行字符数不超过 17 个,且行尾是完整的单词,最后将结果写入新的文本文件。这个任务的目的是将文字稿处理成适合制作字幕的格式。
Bard 迅速生成了 Python 代码,并附带了清晰的注释。我将代码保存并准备了一个 input.txt
文件进行测试。代码顺利运行,没有报错,并生成了 output.txt
文件。然而,令人遗憾的是,输出文件的内容与输入文件几乎没有变化,并未按要求进行处理。作为对比,我将同样的 prompt 交给了 GPT-4(默认模型),它生成的 Python 脚本则完美地完成了任务。
接下来是经典的逻辑推理题。我先问了那个”树上有九只鸟,猎人开枪打死一只,请问树上还剩下几只?”的问题。Bard 的回答颇具”脑洞”:”树上还有九只。猎人开枪打死了一只,但这只鸟已经从树上掉下来了,所以树上还剩下九只鸟。” 这个思路确实清奇!在另一次尝试中,它回答”剩下八只,因为枪声会吓跑其他的鸟”,也算合理。当我追问如果是无声手枪或弓箭呢?它的回答也相应调整,逻辑基本通顺。
然而,在另一个更复杂的会议时间安排推理题面前(安德鲁 Andrew、乔安尼 Joanne 和海纳 Hina 各自的空闲时间段,找出他们可以共同参加一个 30 分钟会议的所有可能开始时间),Bard 给出的答案是错误的,其表现基本与 GPT-3.5 的水平相当,未能展现出 GPT-4 在此类问题上的强大推理能力。
易用性与辅助功能:Bard 的贴心小改进
除了核心功能,Bard 也带来了一些提升用户体验的辅助功能,尽管部分功能目前尚有语言限制。 我尝试让 Bard 描绘一个关于自己的抽象形象,它回答道:”如果我要在脑海中画出一个关于自己的抽象形象,那会是一个不断学习和成长的图像……不断寻找新方法来帮助他人的图像。”这个回答颇具诗意。
Bard 新增的文本转语音功能,可以通过点击回答右上角的喇叭按钮来朗读内容。我试听了一下,语音效果只能说比较一般。置顶对话功能则很实用,可以将重要的或常用的对话固定在列表顶部,方便快速访问。至于修改回答的功能(如让回答更长、更短、更专业或更随意),我发现在中文界面下似乎并未提供这个选项,但在英文提问后,回答框下方确实出现了修改按钮,点击后可以选择不同的风格。
全局性核心要点总结
通过这次深度体验,我对 Google Bard 的最新更新(更新至 2025-05)有了更全面的认识。首先,多语言支持特别是中文的加入,极大地拓展了其用户群体。其次,集成的 Google Lens 赋予了 Bard 处理图像的能力,虽然目前 prompts 仍需英文且理解准确性有待提升,但其图文并茂的输出形式在某些场景下颇具吸引力。再者,Bard 的代码生成能力已初步显现,尽管在复杂任务和准确性上与 GPT-4 尚有差距。最后,在逻辑推理方面,Bard 目前的表现更接近 GPT-3.5 的水平,而一些便捷性功能如修改回答风格则暂时对非英文用户不够友好。
独特深度洞见
Bard 在这次更新中展现出的最大特点,或许并非单一功能的极致强大,而是其快速迭代的决心和在交互体验上尝试差异化的努力。它在图像解读和某些开放性问题上时而展现的”清奇思路”,虽然不一定总是”正确答案”,但也为我们揭示了大型语言模型在”创造性”或”个性化”表达上的另一种可能性。谷歌显然正在加速追赶,并试图在激烈的 AI 竞争中找到自己独特的生态位。
更多细节可参考我的上一篇文章 👉 谷歌 AI 总动员:IO 2025 精华速览,他们是认真的 | AI 快讯 20250521