ChatGPT 最强对手出山!微软 NB 谷歌 Bard,搜索巨头争霸!Video to Video, AI 群雄逐鹿。潘多拉魔盒还是科技爆发开端?

大家好,我是 Axton。最近的 AI 圈可谓是风起云涌,科技巨头们纷纷亮剑,着实让我等看客大呼过瘾。从 2023 年初的喧嚣至今(更新至 2025-05),我们已经能清晰地看到,以 ChatGPT 为代表的生成式 AI 技术,正以前所未有的速度重塑着数字世界的版图。今天,就让我带大家回顾那场由 ChatGPT 点燃的 AI 盛宴,看看微软和谷歌是如何排兵布阵,以及这一切对我们普通用户,尤其是内容创作者,究竟意味着什么。

微软闪击:ChatGPT 加持的新必应 (New Bing) 横空出世

微软将 ChatGPT 融入 Bing 搜索引擎的举动,无疑是那段时间 AI 领域最激动人心的进展之一。 我还记得,在不到一个月前的视频里(指 2023 年初),我曾预测微软会将 ChatGPT 技术整合进自家的必应搜索。没想到,微软的动作如此神速,几乎是以迅雷不及掩耳之势,在 2 月 7 日的发布会上便正式推出了集成 ChatGPT 的新版必应搜索引擎,当时他们称之为 “New Bing” 或 NB。

发布会上,微软副总裁 Yusuf Mehdi(姚师傅)亲自演示了新必应的强大功能。他以购买一台 65 英寸电视机为例,在传统的搜索结果旁边,出现了一个全新的聊天(Chat)框。当姚师傅向聊天框提问:”如果我想要一个适合打游戏的电视机,应该选哪一款呢?” ChatGPT 便迅速分析了搜索结果中的电视型号,并给出了针对性的推荐。对于已经深度体验过 ChatGPT 的朋友来说,这个功能或许不算惊艳,但接下来的演示,才真正展现了新必应的”牛掰之处”。

姚师傅接着在微软自家的 Edge 浏览器中打开了一份长达 15 页的 Gap 公司(一家服装品牌)财报 PDF 文件。然后,他在侧边的聊天窗口中要求 ChatGPT 对这份 PDF 进行汇总,并提炼要点。令人惊叹的是,聊天机器人迅速将财报中的关键信息,如收入状况、市场占有率等核心数据,清晰地整理并呈现出来。更酷的是,姚师傅进一步要求 ChatGPT 将 Gap 公司的财报与另一家服装品牌 Lululemon(主要做瑜伽服)进行对比。这时,集成了 ChatGPT 的搜索引擎展现了其独特优势——它可以实时联网获取信息。它迅速从网上抓取了 Lululemon 的相关数据,并根据要求,将两家公司的对比数据生成了一个结构清晰的表格。试想一下,如果让我们人工完成这些任务,至少也需要数小时甚至一天的时间。而在 AI 的加持下,这一切在瞬间即可完成。这不禁让我畅想,未来的工作场景或许真的会变成:老板让你分析某某公司的财报,你只需告诉 AI,结果便唾手可得。

当时,新必应并未立即对公众开放,用户需要访问其官方网站注册并加入等待列表 (waitlist)。网站上提供了一些预设的示例供用户体验,比如我尝试了一个问题:”我计划在九月为我们的周年纪念日安排一次旅行,从伦敦希思罗机场出发,三小时航程内可以去哪些地方呢?” 新必应的搜索结果在左侧显示传统链接,右侧则是 ChatGPT 给出的详细建议,并且每个建议都附上了信息来源网址,例如推荐去马拉加享受海滩阳光时,会给出参考的旅游文章链接。

为了能更快获得访问权限,微软还给出了一些”小技巧”,比如将微软服务设为电脑默认,或在手机上安装必应应用程序。虽然我当时在我的 Mac 电脑上操作后,并没看到等待排名的明确变化,但这份急切想要体验的心情,相信很多人和我一样。

谷歌应战:吟游诗人 Bard 的谨慎登场

面对微软与 ChatGPT 的凌厉攻势,AI 领域的巨头谷歌也终于亮出了自己的王牌——Bard。 在那段时间,整个科技圈几乎被 ChatGPT 和微软的各种整合新闻所淹没,甚至引发了关于微软是否会借此蚕食谷歌搜索市场份额的大讨论。作为人工智能领域的长期领导者,谷歌在短暂的”沉默”后,终于在 2023 年 2 月初宣布了其对话式 AI 服务 Bard,意图与 ChatGPT 一较高下。

紧接着,谷歌在巴黎举办了一场 AI 直播活动,介绍了其在谷歌翻译、谷歌 Lens、谷歌地图等产品上的 AI 进展,其中最受关注的自然是 Bard。不过,从当时的现场演示来看,Bard 似乎并没有展现出超越 ChatGPT 的特别之处。与微软的策略不同,Bard 最初仅向一部分”受信任的测试者”开放,几周后才逐步扩大到公众范围。Bard 这个名字翻译过来是”吟游诗人”,颇具文艺气息,而 ChatGPT 的名字则非常直白,这或许也反映了两家公司截然不同的企业文化。

那么,为何在 AI 领域一直领先的谷歌,在这次浪潮中显得有些”慢半拍”呢?据一些报道,例如 The Verge 当时的分析,谷歌在向公众推广其 AI 技术时采取了更为谨慎的态度。与其他科技巨头一样,谷歌担心未经完善测试的 AI 可能会因产生不当言论等问题而引发强烈的社会反弹。

这种谨慎,在某种程度上与埃隆·马斯克 (Elon Musk) 对 AI 潜在威胁的担忧不谋而合。马斯克创建 OpenAI 的初衷之一,也是希望通过参与来防止 AI 未来失控。然而,ChatGPT 的空前火爆以及微软的迅速行动,显然让谷歌无法再”稳坐钓鱼台”。Bard 的推出,标志着谷歌对其 AI 技术商业化态度的重大转变。

AI 全面渗透:从文本到视频,内容创作的未来已来

ChatGPT 的出现不仅搅动了搜索引擎市场,更预示着内容创作全流程的 AI 化即将到来。 除了微软和谷歌这两大巨头的正面交锋,另一条看似不那么”重磅”的消息也深深震撼了我。一家名为 Runway Research 的公司推出了名为 Gen-1 的 AI 模型,其核心功能是 “Video-to-Video” 的转换。

我们可以想象一下,在此之前,我们接触更多的是文本到图像的 AI 应用。而 Runway 的 Gen-1 引擎,则允许用户通过文本描述来编辑现有视频,或者将视频转换成各种不同的艺术风格。我当时看到这个演示时,脑海中闪过的第一个念头就是:”该来的,总会来的。” 我们已经拥有了成熟的文本到语音(TTS)、文本到图像技术,内容创作领域当时最令人期待的,或许就是成熟的文本到视频(Text-to-Video)工具了。Runway 的 Gen-1 虽然是视频到视频的编辑,但它无疑向着这个方向迈出了重要一步。如果这项技术普及开来,许多复杂的视频特效制作工作,未来或许都能交由 AI 高效完成。

完整视频请点击观看:

这意味着,对于我们这些内容创作者而言,从文案撰写、语音合成、图像生成,再到视频编辑与特效制作,AI 几乎可以提供一揽子解决方案。当然,当时我们距离真正实用的、人人可用的文本到视频工具还有一段距离,例如 Meta(Facebook 的母公司)当时展示的 Text-to-Video 技术还主要停留在论文和演示阶段。但其展示的效果——通过一段文本描述直接生成视频,或根据图像、视频生成新视频——已经足够令人兴奋。


Highlights

回顾 2023 年,那无疑是人工智能的爆发之年。ChatGPT 如同一颗投入平静湖面的石子,激起了层层涟漪,推动着整个 AI 行业以前所未有的速度向前发展。这究竟是科技大爆发的前奏,还是我们不小心打开了潘多拉的魔盒?现在下结论或许为时尚早。但无论如何,我们都已身处这场 AI 的洪流之中,我们的工作与生活,正因此而发生深刻的改变。

更多关于谷歌在 AI 领域的最新动态,可参考我的上一篇文章 👉 谷歌 AI 总动员:IO 2025 精华速览,他们是认真的 | AI 快讯 20250521

全局性核心要点总结

在我看来,ChatGPT 的横空出世及其引发的连锁反应,至少揭示了几个核心趋势:首先,大型语言模型已经从实验室走向实际应用,并迅速成为科技巨头争夺的战略高地。其次,人机交互的方式正在被颠覆,自然语言将成为我们与机器沟通更主流的桥梁。再次,AI 正在以前所未有的速度普及先进生产力,无论是信息检索、数据分析还是内容创作,门槛都在被大幅降低。最后,这场 AI 革命也伴随着对伦理、就业和社会影响的深切思考,如何在拥抱技术进步的同时规避风险,将是全社会共同面临的课题。

独特深度洞见

从 2023 年初的这场 AI 竞赛回望至今(更新至 2025-05),我最深刻的洞见是:AI 发展的加速度本身,或许才是这场变革中最值得深思的变量。技术迭代的速度、应用普及的速度、以及由此引发的社会适应速度,都呈现出指数级增长的态势。这不仅仅是单个产品的胜利,更是整个创新范式的加速,它要求我们每个人、每个组织都必须以更快的节奏学习、适应和进化。

掌握系统化思维,构建你的AI智能体

工具思维跨越到智能体思维,掌握系统化的方法论与AI智能体构建能力,构建可迁移的AI自动化技能,随时适应新需求!

7 阶实战体系,一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动,效率提升10倍!

◆ 现在订阅,限时享受独家优惠,解锁你的AI竞争优势!



立即开启AI智能体进化之旅 →

Axton二维码

扫码关注获取更多资源

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部