Highlights
若想详细了解 Google I/O 2025 的内容,请看 OpenAI 的 Deep Research 报告: https://blog.botera.io/google-io-2025-ai-highlights-overview/
本期 AI 快讯供您快速预览,由 Gemini 执笔,希望他没有偏心自夸。
忘了那些渐进式更新吧,Google I/O 2025 像是往 AI 这把火里直接浇了一桶航空燃油。核心信息就一个:谷歌要把自家 AI(特别是 Gemini)塞进你用的所有东西里,还要让它变得更强、更会干活。
核心引擎大升级:Gemini 2.5
- “Deep Think”模式:Gemini 2.5 Pro 现在能像个深思熟虑的专家,在回答复杂数学、编程问题前并行考虑多种假设,准确率飙升。
- 超长上下文与原生音频:能处理百万级 Token 的输入,还能用自然、多变的语音直接回答你。
- Imagen 4 & Veo 3:图像生成更懂文字,视频生成能“声画同轨”,还有个叫 Flow 的应用,用提示词就能搞出电影感的短片。
一些酷玩意儿和新”钞能力”
- Google Beam:全息视频通话 Project Starline 转正,开会就像面对面。
- “AI Ultra”订阅:月费250刀,给你用最顶级的 Google AI 模型和更多配额,摆明了要在高端市场和 OpenAI、Anthropic 掰手腕。
AI 全面”入侵”谷歌产品
这是重头戏,Gemini 几乎无处不在了:
-
搜索大变样:
- AI Mode 成主力:直接在搜索页用对话方式提问,AI 给你详细报告。号称业界最快。
- Deep Search:针对复杂研究,几分钟出带引用的专家级报告。
- Search Live:手机摄像头对准啥,就能问啥,AI 实时解答。“万物皆可问”。
-
AI 不止动脑,还动手(智能代理):
- 购票助手:AI 帮你浏览网站、筛选、填表买票。
- AI 自动比价下单:AI 监测价格,到心理价位就自动用 Google Pay 下单(会先问你)。
-
Workspace 和安卓更智能:
- Gmail 个性化智能回复:AI 根据你的邮件、文档,用你的语气写回复。
- Meet 实时语音翻译:跨语言开会,声音口型都像对方。
- Chrome 内置 Gemini,安卓手机免费用 Gemini Live(摄像头实时问答)。
-
Gemini App (原 Bard) 更强大:
- Deep Research:上传文件,AI 帮你分析。
- Canvas:对话生成图表、测验题、甚至播客,还能“对话生成应用”。
- Agent Mode:给 AI 个任务(如找合租房),它能自动上网、筛选、预约,还能通过“示范并重复”学习新技能。
硬核基建与开发者福利
- TPU v7 “Ironwood”:谷歌自研的 AI 芯片,性能猛增,成本降低,是这一切的算力基础。
- Google AI Studio:一站式开发平台,拖拽点选,一句话、一张图就能生成完整 Web 应用。
- Jules 自治编程代理:开发者的大招。给它代码库访问权和任务(如”修复这个 Bug”),它能自主计划、后台编码、提交 PR 让你审查。这可比 Copilot 更进了一大步。
- Stitch:用自然语言或草图直接生成 UI 设计稿和前端代码。
简单说下竞争:谷歌的底气
Gemini 2.5 在不少基准上已经不输甚至超越 GPT-4,而且性价比可能更高。但 Google 最大的王牌是庞大的产品生态和用户群。把 AI 无缝整合进搜索、Gmail、安卓这些几十亿人每天都在用的工具里,这种体验是 OpenAI 和 Anthropic 短期内难以复制的。“AI 应该在用户已有的流程里,而不是让用户去适应 AI。”
小结
Google I/O 2025 不是在炫技,而是在明确地告诉世界:AI 的下半场,谷歌要全面发力,重新定义游戏规则。 他们要把 AI 从一个”聊天机器人”变成一个无处不在、能看、能听、能说、能思考,甚至能替你完成任务的个人智能中枢。对我们开发者和内容创作者来说,这意味着一大波新工具和新机会正在涌来。