大家好,我是 Axton。就在不久前的 Google I/O 大会 2023 上,谷歌可谓是火力全开,一口气宣布了上百项更新,其中提及 AI 的次数高达 143 次,其股价也应声大涨 560 亿美元。这无疑是一场谷歌全面拥抱 AI、宣告自己是一家”AI 优先公司”(AI First Company)的盛会。站在 2025 年的今天回望,那次大会的许多发布都已深刻影响了我们与科技互动的方式。接下来,就让我带大家深入回顾那些激动人心的时刻,看看谷歌是如何用 AI 重塑未来的。
视觉 AI 的魔力:照片编辑与实景导航新境界
谷歌在视觉 AI 领域的创新,让我们的数字生活体验更加智能和便捷。 相信大家对谷歌相册的”魔术橡皮擦”功能都不陌生,而在这次大会上,它进化到了更为强大的”魔术编辑”(Magic Editor)。我记得演示中有一张老奶奶的照片,AI 不仅能轻松移除背景中的路人甲和人物身上的背包带,还能将整体色调调整得更加鲜艳。但真正令人惊叹的是,它可以将整个人像向右平移,使得远处的瀑布恰好落在老奶奶的手心上方,这种对画面元素的智能理解和重构,着实展现了”魔术”二字。
另一个生动的例子是一个小男孩在长椅上拿着气球的照片。拍摄时,小男孩没有位于画面中央,气球也被裁掉了一部分。通过魔术编辑,AI 不仅能将小男孩智能地移动到画面中心,还能利用算法将缺失的气球部分完美补全,效果天衣无缝。最后再对整体色调进行增强,一张构图完美、色彩生动的照片便诞生了。
而在谷歌地图方面,推出的”沉浸式路线视图”(Immersive View for Routes)也让我印象深刻。它允许你在出发前,以一种近乎真实驾驶的体验,去可视化路线的每一个细节。我仿佛真的开车行驶在规划的路线上,沿途的自行车道、人行道、交叉路口乃至停车场等设施都清晰可见。更酷的是,通过一个时间滑块,你还能查看路线在不同时间点的空气质量信息、天气变化(比如预知途中是否会下雨或下雪),甚至 AI 还会模拟特定时间段特定路段可能的车流量,帮助你提前规避拥堵。
Google I-O 大会 2023 见证 Bard 的华丽蜕变
曾经备受争议的 Google Bard,在这次大会上迎来了脱胎换骨的升级,展现出强大的潜力。 我还记得 Bard 刚推出时,功能相对薄弱,我还专门做过视频进行对比。但这次,它真的不一样了。首先,Bard 开始全面支持开发者,你可以用它来进行开发、调试、解释代码,甚至让它优化代码,目前已支持超过 20 种开发语言(更新至 2025-05),并且可以直接将代码导出到 Colab 和 Replit。
对于非开发用户而言,Bard 的另一项更新则更为实用:对话记录可以直接导出到 Gmail 或 Google Docs。相较于某些竞品相对简陋的导出功能,Bard 的这一点无疑更贴近用户需求。此外,Bard 还引入了与第三方服务和谷歌自家应用的集成,这类似于 OpenAI 的插件系统。例如,Bard 在提供搜索结果时可以附带图片;它现在也能理解图片内容,比如给它两张狗狗的照片,让它写个有趣的标题,它便能根据狗狗的表情和场景写出”当你试图确定哪一个是好孩子的时候”这样的文字。
与 Google Maps 的集成也十分亮眼,当你在 Bard 中搜索学校时,它可以直接在地图上标出学校位置。在 Bard 中生成的表格,也能一键导出到 Google Sheets。更令人兴奋的是,谷歌宣布与 Adobe 合作,Bard 将与 Adobe Firefly 结合,实现强大的文生图功能,这无疑是对 AI 图片生成市场投下的一颗重磅炸弹。最重要的是,Bard 取消了等待列表,已在超过 180 个国家和地区开放(更新至 2025-05),并计划支持更多语言。
PaLM 2 与 Gemini:驱动 AI 创新的强大引擎
这一切令人瞩目的 AI 进步,其核心驱动力便是谷歌强大的自研大模型 PaLM 2。 在 I/O 大会上,谷歌宣布有超过 25 个由 PaLM 2 驱动的新产品和新功能(更新至 2025-05)。PaLM 2 提供了四种不同尺寸的模型,其中最小的 Gecko 模型甚至可以在移动设备上离线运行。
那么,PaLM 2 究竟先进在何处?主要体现在其卓越的多语言能力、推理能力和编码能力。它在包含 100 多种语言的多语言文本上进行了训练,据说其语言能力已达到可以”教授”这门语言的程度。在推理方面,PaLM 2 的训练数据涵盖了数学表达式、科学论文和各类网页,因此在逻辑、常识推理及数学方面表现出色。至于编码能力,它也在大量的代码数据集上进行了训练,主流编程语言对它而言都不在话下。
基于 PaLM 2,谷歌还推出了两个专业版本:Sec-PaLM,专为网络安全领域打造;以及 Med-PaLM 2,利用医学知识进行训练。据谷歌 CEO Sundar Pichai 介绍,Med-PaLM 2 是第一个在美国医学执照考试中表现出专家水平的大型语言模型。同时,谷歌也透露其语言模型研究的重心已转向规模更大、能力更强的多模态模型 Gemini,这被广泛认为是直接对标传说中的 GPT-5。
完整视频请点击观看:
Duet AI for Workspace:AI 与办公的无缝二重唱
谷歌将 AI 深度融入 Workspace 全家桶,推出了 Duet AI,旨在打造人与 AI 无缝协作的办公新范式。 “Duet AI”这个名字本身就强调了 AI 如同工作中的好搭档,与你进行一场高效的”二重唱”。大会上展示了几个非常实用的场景:比如仅用 7 个词的提示语,就能生成一篇专业的招聘广告;或者根据你的需求,AI 自动帮你生成数据表格的表结构。
在制作演示文稿(PPT)时,Duet AI 更是能大显身手,不仅可以根据你的指令生成各种图片,还能为这些图片应用不同的艺术风格,如卡通风格、照片风格等。Workspace 中还引入了一个名为”Sidekick”的右边栏,它能根据你当前的工作情境提供智能建议,这与微软 Bing 的侧边栏有异曲同工之妙。比如,当你写作遇到瓶颈时,Sidekick 会主动提出几个启发性的问题;在处理邮件时,它可以直接识别并提取邮件中嵌入的 Google Sheets 链接,并从中抓取数据。最让我觉得实用的是,Sidekick 甚至可以为每一页 PPT 一键生成完整的演讲稿,即使你临近会议才拿到 PPT,也无需惊慌,让 Sidekick 帮你准备讲稿,照着念就行了。
AI 赋能下的谷歌搜索:颠覆传统信息获取体验
作为谷歌的立身之本,搜索功能在 AI 的加持下,正朝着更智能、更个性化的方向进化。 我对其中一个搜索示例印象深刻:用户提问”布莱斯峡谷和拱门国家公园,哪一个更适合带三个孩子和一条狗的家庭?”谷歌搜索首先给出了对这两个地点的简介摘要,并在下方提供了建议的后续追问。点击”Follow up”,便会直接进入对话窗口,你可以在搜索结果的基础上继续提问。AI 甚至能给出更细致的说明,例如告诉你在这两个地方哪些路线可以带狗,哪些路线适合婴儿车。
另一个例子是根据特定目的进行搜索,比如”适合 5 公里通勤且有小山坡路况的自行车”。谷歌搜索会首先列出你需要考虑的方面,如电机的功率、电池续航、悬架类型等,然后在下方展示相关的产品推荐和用户评价。这些结果来源于每小时高达 18 亿条的实时更新信息,确保了搜索结果不仅切合需求,而且是最新的,极大地提升了搜索体验。当时,想要体验这些 AI 驱动的搜索新功能,还需要通过 Google Labs 加入等待列表。
Project Tailwind:AI 笔记的未来雏形?
在众多发布中,Project Tailwind 作为一个 AI 笔记原型项目,尤为引人遐想。 这可以说是我个人最感兴趣的项目之一,尽管当时它还处于原型阶段。简单来说,Tailwind 旨在成为一个 AI 笔记本,你可以将所有的笔记、需要阅读的资料、文档以及学习课程都交给它。然后,你便可以像与一位私人导师对话一样,向它提问,它会帮助你学习和理解这些材料。
演示中,一位谷歌员工将 Google Drive 中的课程笔记导入 Tailwind,后者便自动创建了学习指南,梳理出关键主题,并提出了建议思考的问题。更强大的是,它还能直接从多个原始文档中提取信息,创建一个完整的术语表。我相信,这样的功能一定是所有笔记爱好者梦寐以求的。当然,想要尝鲜同样需要加入等待列表,而且其最终能否成功推出、何时推出,在当时还是个未知数。
Responsible AI:为强大 AI 技术装上伦理罗盘
面对 AI 日益增长的强大能力,谷歌也强调了”负责任的 AI”(Responsible AI)的重要性。 谷歌副总裁 James Manyika 提到:”在人工智能方面勇敢,就意味着要从一开始就要负责任。”AI 的力量究竟有多大?James 举了 AlphaFold 的例子——这个预测蛋白质结构的 AI,仅用了几周时间就取得了相当于人类科学家需要花费 4 亿年才能达成的进展。这足以说明,AI 的责任是一个至关重要的话题。
为了让用户更好地辨别信息真伪,谷歌展示了其在负责任 AI 方面所做的努力。例如,当你看到一张登月照片,如何判断其真伪?谷歌会通过提供背景信息来辅助你,比如这张图片或类似图片首次出现的时间和地点,以及在哪些新闻网站或社交媒体上可以看到它。这些信息将帮助用户做出更明智的判断。
全局性核心要点总结
回顾整场 Google I-O 大会 2023,有几个核心观点贯穿始终,对我们理解谷歌的 AI 战略乃至整个行业发展都极具价值。首先,AI 已不再是谷歌某个部门的探索,而是全面融入其核心产品与服务的顶层战略。其次,谷歌着重展示了 AI 在解决实际问题、提升用户体验方面的巨大潜力,无论是照片编辑、地图导航还是办公协作,都变得更加智能高效。再次,强大的自研基础模型(如 PaLM 2)是驱动这一切创新的坚实底座,为上层应用提供了源源不断的动力。同时,谷歌正致力于构建一个互联互通的 AI 生态系统,让不同产品和服务间的 AI 能力能够协同增效。最后,面对 AI 技术的飞速发展,谷歌也明确表达了对伦理和社会责任的重视,强调发展”负责任的 AI”。
独特深度洞见
在我看来,Google I-O 大会 2023 最深刻的启示在于,它标志着谷歌从一家”移动优先”的公司,真正转型为一家”AI 优先”的公司。这不仅仅是口号的转变,更是其技术研发、产品设计乃至企业文化的一次深层重塑。这种转变的决心和执行力,体现在 AI 技术以前所未有的速度和广度渗透到谷歌几乎所有的核心业务中。这预示着一个由 AI 深度赋能的全新数字时代正在加速到来,我们与信息的交互方式、工作的协作模式,乃至生活的方方面面,都将因此而改变。
以上就是我对 Google I-O 大会 2023 的精华回顾与思考。希望这些内容能帮助大家更好地理解谷歌在 AI 领域的布局和雄心。