Google I-O 大会 8 项精彩片段「懒人包」Google AI 全线出击 | 回到Axton

大家好，我是 Axton。就在不久前的 Google I/O 大会 2023 上，谷歌可谓是火力全开，一口气宣布了上百项更新，其中提及 AI 的次数高达 143 次，其股价也应声大涨 560 亿美元。这无疑是一场谷歌全面拥抱 AI、宣告自己是一家”AI 优先公司”（AI First Company）的盛会。站在 2025 年的今天回望，那次大会的许多发布都已深刻影响了我们与科技互动的方式。接下来，就让我带大家深入回顾那些激动人心的时刻，看看谷歌是如何用 AI 重塑未来的。

视觉 AI 的魔力：照片编辑与实景导航新境界

谷歌在视觉 AI 领域的创新，让我们的数字生活体验更加智能和便捷。 相信大家对谷歌相册的”魔术橡皮擦”功能都不陌生，而在这次大会上，它进化到了更为强大的”魔术编辑”（Magic Editor）。我记得演示中有一张老奶奶的照片，AI 不仅能轻松移除背景中的路人甲和人物身上的背包带，还能将整体色调调整得更加鲜艳。但真正令人惊叹的是，它可以将整个人像向右平移，使得远处的瀑布恰好落在老奶奶的手心上方，这种对画面元素的智能理解和重构，着实展现了”魔术”二字。

另一个生动的例子是一个小男孩在长椅上拿着气球的照片。拍摄时，小男孩没有位于画面中央，气球也被裁掉了一部分。通过魔术编辑，AI 不仅能将小男孩智能地移动到画面中心，还能利用算法将缺失的气球部分完美补全，效果天衣无缝。最后再对整体色调进行增强，一张构图完美、色彩生动的照片便诞生了。

而在谷歌地图方面，推出的”沉浸式路线视图”（Immersive View for Routes）也让我印象深刻。它允许你在出发前，以一种近乎真实驾驶的体验，去可视化路线的每一个细节。我仿佛真的开车行驶在规划的路线上，沿途的自行车道、人行道、交叉路口乃至停车场等设施都清晰可见。更酷的是，通过一个时间滑块，你还能查看路线在不同时间点的空气质量信息、天气变化（比如预知途中是否会下雨或下雪），甚至 AI 还会模拟特定时间段特定路段可能的车流量，帮助你提前规避拥堵。

Google I-O 大会 2023 见证 Bard 的华丽蜕变

曾经备受争议的 Google Bard，在这次大会上迎来了脱胎换骨的升级，展现出强大的潜力。 我还记得 Bard 刚推出时，功能相对薄弱，我还专门做过视频进行对比。但这次，它真的不一样了。首先，Bard 开始全面支持开发者，你可以用它来进行开发、调试、解释代码，甚至让它优化代码，目前已支持超过 20 种开发语言（更新至 2025-05），并且可以直接将代码导出到 Colab 和 Replit。

对于非开发用户而言，Bard 的另一项更新则更为实用：对话记录可以直接导出到 Gmail 或 Google Docs。相较于某些竞品相对简陋的导出功能，Bard 的这一点无疑更贴近用户需求。此外，Bard 还引入了与第三方服务和谷歌自家应用的集成，这类似于 OpenAI 的插件系统。例如，Bard 在提供搜索结果时可以附带图片；它现在也能理解图片内容，比如给它两张狗狗的照片，让它写个有趣的标题，它便能根据狗狗的表情和场景写出”当你试图确定哪一个是好孩子的时候”这样的文字。

与 Google Maps 的集成也十分亮眼，当你在 Bard 中搜索学校时，它可以直接在地图上标出学校位置。在 Bard 中生成的表格，也能一键导出到 Google Sheets。更令人兴奋的是，谷歌宣布与 Adobe 合作，Bard 将与 Adobe Firefly 结合，实现强大的文生图功能，这无疑是对 AI 图片生成市场投下的一颗重磅炸弹。最重要的是，Bard 取消了等待列表，已在超过 180 个国家和地区开放（更新至 2025-05），并计划支持更多语言。

PaLM 2 与 Gemini：驱动 AI 创新的强大引擎

这一切令人瞩目的 AI 进步，其核心驱动力便是谷歌强大的自研大模型 PaLM 2。 在 I/O 大会上，谷歌宣布有超过 25 个由 PaLM 2 驱动的新产品和新功能（更新至 2025-05）。PaLM 2 提供了四种不同尺寸的模型，其中最小的 Gecko 模型甚至可以在移动设备上离线运行。

那么，PaLM 2 究竟先进在何处？主要体现在其卓越的多语言能力、推理能力和编码能力。它在包含 100 多种语言的多语言文本上进行了训练，据说其语言能力已达到可以”教授”这门语言的程度。在推理方面，PaLM 2 的训练数据涵盖了数学表达式、科学论文和各类网页，因此在逻辑、常识推理及数学方面表现出色。至于编码能力，它也在大量的代码数据集上进行了训练，主流编程语言对它而言都不在话下。

基于 PaLM 2，谷歌还推出了两个专业版本：Sec-PaLM，专为网络安全领域打造；以及 Med-PaLM 2，利用医学知识进行训练。据谷歌 CEO Sundar Pichai 介绍，Med-PaLM 2 是第一个在美国医学执照考试中表现出专家水平的大型语言模型。同时，谷歌也透露其语言模型研究的重心已转向规模更大、能力更强的多模态模型 Gemini，这被广泛认为是直接对标传说中的 GPT-5。

完整视频请点击观看：

Duet AI for Workspace：AI 与办公的无缝二重唱

谷歌将 AI 深度融入 Workspace 全家桶，推出了 Duet AI，旨在打造人与 AI 无缝协作的办公新范式。 “Duet AI”这个名字本身就强调了 AI 如同工作中的好搭档，与你进行一场高效的”二重唱”。大会上展示了几个非常实用的场景：比如仅用 7 个词的提示语，就能生成一篇专业的招聘广告；或者根据你的需求，AI 自动帮你生成数据表格的表结构。

在制作演示文稿（PPT）时，Duet AI 更是能大显身手，不仅可以根据你的指令生成各种图片，还能为这些图片应用不同的艺术风格，如卡通风格、照片风格等。Workspace 中还引入了一个名为”Sidekick”的右边栏，它能根据你当前的工作情境提供智能建议，这与微软 Bing 的侧边栏有异曲同工之妙。比如，当你写作遇到瓶颈时，Sidekick 会主动提出几个启发性的问题；在处理邮件时，它可以直接识别并提取邮件中嵌入的 Google Sheets 链接，并从中抓取数据。最让我觉得实用的是，Sidekick 甚至可以为每一页 PPT 一键生成完整的演讲稿，即使你临近会议才拿到 PPT，也无需惊慌，让 Sidekick 帮你准备讲稿，照着念就行了。

AI 赋能下的谷歌搜索：颠覆传统信息获取体验

作为谷歌的立身之本，搜索功能在 AI 的加持下，正朝着更智能、更个性化的方向进化。 我对其中一个搜索示例印象深刻：用户提问”布莱斯峡谷和拱门国家公园，哪一个更适合带三个孩子和一条狗的家庭？”谷歌搜索首先给出了对这两个地点的简介摘要，并在下方提供了建议的后续追问。点击”Follow up”，便会直接进入对话窗口，你可以在搜索结果的基础上继续提问。AI 甚至能给出更细致的说明，例如告诉你在这两个地方哪些路线可以带狗，哪些路线适合婴儿车。

另一个例子是根据特定目的进行搜索，比如”适合 5 公里通勤且有小山坡路况的自行车”。谷歌搜索会首先列出你需要考虑的方面，如电机的功率、电池续航、悬架类型等，然后在下方展示相关的产品推荐和用户评价。这些结果来源于每小时高达 18 亿条的实时更新信息，确保了搜索结果不仅切合需求，而且是最新的，极大地提升了搜索体验。当时，想要体验这些 AI 驱动的搜索新功能，还需要通过 Google Labs 加入等待列表。

Project Tailwind：AI 笔记的未来雏形？

在众多发布中，Project Tailwind 作为一个 AI 笔记原型项目，尤为引人遐想。 这可以说是我个人最感兴趣的项目之一，尽管当时它还处于原型阶段。简单来说，Tailwind 旨在成为一个 AI 笔记本，你可以将所有的笔记、需要阅读的资料、文档以及学习课程都交给它。然后，你便可以像与一位私人导师对话一样，向它提问，它会帮助你学习和理解这些材料。

演示中，一位谷歌员工将 Google Drive 中的课程笔记导入 Tailwind，后者便自动创建了学习指南，梳理出关键主题，并提出了建议思考的问题。更强大的是，它还能直接从多个原始文档中提取信息，创建一个完整的术语表。我相信，这样的功能一定是所有笔记爱好者梦寐以求的。当然，想要尝鲜同样需要加入等待列表，而且其最终能否成功推出、何时推出，在当时还是个未知数。

Responsible AI：为强大 AI 技术装上伦理罗盘

面对 AI 日益增长的强大能力，谷歌也强调了”负责任的 AI”（Responsible AI）的重要性。 谷歌副总裁 James Manyika 提到：”在人工智能方面勇敢，就意味着要从一开始就要负责任。”AI 的力量究竟有多大？James 举了 AlphaFold 的例子——这个预测蛋白质结构的 AI，仅用了几周时间就取得了相当于人类科学家需要花费 4 亿年才能达成的进展。这足以说明，AI 的责任是一个至关重要的话题。

为了让用户更好地辨别信息真伪，谷歌展示了其在负责任 AI 方面所做的努力。例如，当你看到一张登月照片，如何判断其真伪？谷歌会通过提供背景信息来辅助你，比如这张图片或类似图片首次出现的时间和地点，以及在哪些新闻网站或社交媒体上可以看到它。这些信息将帮助用户做出更明智的判断。

全局性核心要点总结

回顾整场 Google I-O 大会 2023，有几个核心观点贯穿始终，对我们理解谷歌的 AI 战略乃至整个行业发展都极具价值。首先，AI 已不再是谷歌某个部门的探索，而是全面融入其核心产品与服务的顶层战略。其次，谷歌着重展示了 AI 在解决实际问题、提升用户体验方面的巨大潜力，无论是照片编辑、地图导航还是办公协作，都变得更加智能高效。再次，强大的自研基础模型（如 PaLM 2）是驱动这一切创新的坚实底座，为上层应用提供了源源不断的动力。同时，谷歌正致力于构建一个互联互通的 AI 生态系统，让不同产品和服务间的 AI 能力能够协同增效。最后，面对 AI 技术的飞速发展，谷歌也明确表达了对伦理和社会责任的重视，强调发展”负责任的 AI”。

独特深度洞见

在我看来，Google I-O 大会 2023 最深刻的启示在于，它标志着谷歌从一家”移动优先”的公司，真正转型为一家”AI 优先”的公司。这不仅仅是口号的转变，更是其技术研发、产品设计乃至企业文化的一次深层重塑。这种转变的决心和执行力，体现在 AI 技术以前所未有的速度和广度渗透到谷歌几乎所有的核心业务中。这预示着一个由 AI 深度赋能的全新数字时代正在加速到来，我们与信息的交互方式、工作的协作模式，乃至生活的方方面面，都将因此而改变。

以上就是我对 Google I-O 大会 2023 的精华回顾与思考。希望这些内容能帮助大家更好地理解谷歌在 AI 领域的布局和雄心。

掌握系统化思维，构建你的AI智能体

从工具思维跨越到智能体思维，掌握系统化的方法论与AI智能体构建能力，构建可迁移的AI自动化技能，随时适应新需求！

◆ 7 阶实战体系，一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动，效率提升10倍！

◆ 现在订阅，限时享受独家优惠，解锁你的AI竞争优势！

立即开启AI智能体进化之旅 →

扫码关注获取更多资源