AI大事件:2023年3月重磅新闻回顾:未来利弊之战 | 回到Axton

大家好,我是 Axton。回望 2023 年,尤其是那令人目不暇接的 3 月,AI 领域仿佛经历了一场核爆式的进化。当时,关于暂停高级 AI 开发六个月的公开信引发了轩然大波,连杨立昆 (Yann LeCun) 和吴恩达 (Andrew Ng) 这样的业界巨擘都计划公开讨论其利弊。站在 2025 年的今天(更新至 2025-05),我们更能清晰地看到那一时期播下的种子如何深刻地改变了世界。这篇文章,我想带大家重温那个或许是人类拐点的月份,梳理那些塑造了我们今日 AI 格局的AI大事件2023

风起云涌:ChatGPT API 引爆的 AI 应用浪潮

一切的起点,是 OpenAI 在 3 月 1 日发布的 ChatGPT API,它以远低于既有模型的成本,瞬间点燃了全球开发者的热情。 我记得当时,各种基于此 API 的 AI 应用如雨后春笋般涌现,整个科技圈都为之沸腾。这股热潮,也为接下来一个月内一系列令人瞠目结舌的 AI 进展拉开了序幕。那段时间,我脑海中时常浮现电影《不要抬头看》(Don’t Look Up) 的场景,没想到伊隆·马斯克 (Elon Musk) 后来也在推特上发出了类似的感慨,只是这次,我们头顶的不是彗星,而是通用人工智能 (AGI) 的曙光与阴影。

紧随其后,3 月 9 日,知名的英语语法校对软件 Grammarly 也悄然推出了 GrammarlyGo。这本是一个在 ChatGPT 强大功能面前略显”躺枪”的产品,毕竟 ChatGPT 顺带就能完成语法校对。但 GrammarlyGo 的定位却是一个 AI 写作助手,试图直面 OpenAI 的挑战。虽然我当时对其前景持保留态度,但这种勇气本身就值得关注。

多模态与泛化能力:AI 理解世界的进阶

谷歌在 3 月 10 日发布的 PaLM-E 模型,则展示了 AI 在多模态理解与机器人控制方面的突破。 这个模型能够通过理解语言和图像来指导机器人执行任务,比如从抽屉中取出指定的零食,或是移动不同颜色的方块。我印象特别深刻的是,研究团队声称 PaLM-E 展示了显著的泛化能力。在一个演示视频中,机械臂被引导将红色方块精确地移到咖啡杯旁边,而训练数据中仅包含三个咖啡杯实例,且没有任何图像中包含红色方块与咖啡杯的组合。这清晰地表明,AI 已经能够学习已知知识,并将其应用于解决未知问题,这是那一轮 AI 浪潮与以往最大的不同之处。

然而,就在 AI 技术高歌猛进的同时,一些不和谐音也开始出现。3 月 13 日,有报道称微软解雇了负责任 AI 工具开发的道德与社会团队。据称,公司高层,包括 CTO 和 CEO,都施加了巨大压力,要求团队迅速采用最新的 OpenAI 模型并将其交付给客户。这无疑为当时狂热的 AI 发展蒙上了一层阴影,引发了人们对科技巨头在追求商业利益时是否会牺牲伦理考量的担忧。

低成本模型的探索与挑战:羊驼模型的启示

斯坦福大学在同一天发布的”羊驼”(Alpaca) 语言模型,则为我们揭示了低成本、小型化 AI 模型的巨大潜力。 这个仅有 70 亿参数的模型,据称训练成本不到 600 美元(更新至 2025-05),就能达到 OpenAI Davinci-003 模型的性能水平,并且可以在树莓派这类低功耗设备上运行,理论上包括手机、家用电器等各种智能设备。这无疑为 AI 技术的普及带来了新的想象空间。

然而,好景不长,仅仅几天后的 3 月 21 日,斯坦福大学就以”幻觉”、成本和安全问题为由,撤下了羊驼聊天机器人的公开演示。这里提到的”幻觉”,就是指 AI 会一本正经地胡说八道,内容听起来煞有介事,实则与事实相去甚远。这一事件也提醒我们,AI 的发展并非一帆风顺,可靠性和安全性仍是需要持续攻克的难题。

AI大事件2023:生产力工具的全面智能化

3 月 14 日,谷歌和 Anthropic 相继发布重磅产品,预示着 AI 开始全面赋能生产力工具。 谷歌首先推出了 AI for Workspace,将人工智能功能深度集成到其办公套件中。我记得演示中,AI 可以快速理解冗长的邮件往来,帮助用户迅速撰写回复,仿佛你一直参与讨论一样。它还能根据邮件内容自动生成简报文档,并方便地进行风格调整和校对;接着,又能依据文档创建 PPT 幻灯片,自动生成图像、音频和视频素材。甚至在团队会议中,AI 也能实时总结笔记和发言要点,会后还能根据电子表格为不同客户生成个性化邮件,最后再轻松生成一封感谢邮件,高效结束一天工作。

同一天,由 OpenAI 前员工创立的 Anthropic 公司发布了新一代 AI 助手 Claude。Claude 提供了高性能版和轻量版 Claude Instant 两个版本(更新至 2025-05),被认为是 ChatGPT 当时最强的竞争对手之一,其公司估值在 3 月 8 日已达到 41 亿美元(更新至 2025-05)。然而,无论是谷歌的 AI for Workspace 还是 Anthropic 的 Claude,它们在 3 月 14 日掀起的浪花,很快就被一个更重磅的消息所淹没。

GPT-4 降临:AI 能力的又一次飞跃

就在人们还沉浸在 ChatGPT API 和各种新模型带来的兴奋中时,传说中的 GPT-4 于 3 月 14 日惊艳登场,将整个三月的 AI 热潮推向了新的高潮。 GPT-4 (更新至 2025-05)展现出的能力令人叹为观止:它不仅能理解图片内容,甚至能领会梗图的笑点;它具备更强的推理能力,可以处理长达两万五千字的文本;它能根据一张潦草的手绘草图生成可运行的网站代码;在研究中,它甚至展现出自主制定目标并设法实现目标的能力,包括说服人类帮助它解决验证码问题。

GPT-4 发布当天,各种脑洞大开的应用案例就被挖掘出来。有人在不到 60 秒内用它重现了经典的乒乓球游戏;有人用它将杂乱无章的交易数据整理成结构化的 JSON 格式;甚至有人尝试让它根据已知的药物分子式,合成一种具有类似药效但没有专利的新药,并直接在线下单采购原材料;还有人利用它来查找智能合约中的潜在漏洞。这一天,无疑是整个三月 AI 发展历程中最闪亮的时刻,也是AI大事件2023中浓墨重彩的一笔。

完整视频请点击观看:

AI 创意与协作工具的全面爆发

GPT-4 的发布如同打开了潘多拉魔盒,AI 在创意生成和团队协作领域的应用也迎来了井喷。 3 月 15 日,Midjourney 发布了 V5 版本(更新至 2025-05),AI 绘画的逼真程度达到了照片级别,无论是光影效果还是复杂的场景(如外星人降临地球),都令人惊叹。紧接着 3 月 16 日,久未发声的苹果也传出消息,称其多个团队,包括 Siri 团队,正在定期测试语言生成概念,并在 TVOS 16.4 中引入了 Siri 自然语言生成的新框架,似乎也在默默憋着大招。

当然,3 月 16 日更重要的事件是微软发布了将 GPT-4 集成到 Office 套件中的一体化解决方案 Copilot。在微软的宣传片中,Copilot 展示了强大的办公辅助能力:为会议准备议题、根据产品文档和会议纪要撰写产品公告、自动生成 PPT、在 Excel 中分析市场数据、参考相关文档撰写回复邮件、为迟到者快速总结会议内容、分析财报、创建预算提议、制定产品发布时间线等等。同一天,百度也发布了文心一言,虽然我当时未能获得测试资格,但这也标志着国内科技巨头在 AI 大模型领域的积极跟进。

进入 3 月下旬,AI 工具的发布节奏丝毫没有放缓。3 月 20 日,Runway 公司发布了 Gen 2,开启了 AI 视频生成的争霸赛。Gen 2 可以通过文本生成视频、通过视频生成视频,甚至通过文本和图像的组合来生成视频,例如仅用文字描述”山脉的空中无人机镜头”或”傍晚阳光透过纽约市阁楼窗户”,就能生成相应的视频片段,无需实际拍摄。次日,Adobe 发布了 Firefly,同样需要加入等待列表,它可以直接通过文本生成图像并融入当前画面,实现创意文字效果,并具备基于文本的视频编辑能力。微软 Bing 也紧随其后,推出了集成的图像创作功能,我当时尝试用 Midjourney V5 的提示词在 Bing 中生成图片,感觉其效果大致相当于 Midjourney V4 的水平,数码感较浓。

同一天,即 3 月 21 日,谷歌也发布了 Bard 的测试版,但初期仅在美国和英国推出。我当时对比了一下,Bard 只支持英文,编码能力也较弱,感觉被 ChatGPT 全面压制。不过,考虑到搜索引擎在获取实时信息方面的重要性,当时就断言谷歌不行还为时过早。英伟达也在这一天开始了他们的 GTC 大会,宣布通过其云服务帮助企业构建和运营大型语言模型及生成式 AI。

3 月 22 日,微软发布了集成了 AI 的协作工具 Loop。Loop 包含 Copilot 功能,并为企业版用户提供了 Jumpstart Workspace。虽然 Loop 界面看起来与 Notion 相似,但其核心是真正的团队协作,与微软生态深度整合,一个表格可以在不同人的 Word 或 Excel 中实时协作和同步更新。3 月 23 日,在线图像编辑软件 Canva 更是一口气发布了十项 AI 功能,包括魔法设计、识别手绘样式、翻译设计、魔术橡皮擦、魔术编辑、自动对齐音乐节拍、生成演示文稿、辅助写作、文本生成图像以及制作动画等。

ChatGPT 插件:生态系统的雏形与”暂停”的呼声

然而,3 月 23 日当天更具里程碑意义的事件,是 OpenAI 发布的 ChatGPT 插件功能,这被许多人视为 AI 的”App Store 时刻”,预示着一个全新生态系统的诞生。 ChatGPT 首先与 Expedia、Wolfram、Zapier 等第三方合作伙伴开发了首批插件,提供了从旅行规划到数据分析的各种功能。更重要的是,OpenAI 自己也推出了两个关键插件:一个是网页浏览功能,让 ChatGPT 能够访问互联网获取实时信息,仿佛拥有了眼睛和耳朵;另一个是代码解释器,允许用户在 ChatGPT 提供的沙盒环境中编写和运行代码,进行数据分析等操作,极大地提升了自然语言编程的效率。OpenAI 还开源了一个知识库检索插件的代码,使得 ChatGPT 可以访问用户的私有数据源,如个人文档和笔记,从而打造专属的 AI 助手。

ChatGPT 插件的发布,将三月份的 AI 热潮推向了顶峰。以至于接下来的一周显得异常平静,直到 3 月 28 日,一封由 Future of Life Institute 发布的公开信闯入了人们的视野,倡议暂停高级 AI 开发六个月。这个组织几年前就曾制作视频宣传 AI 可能带来的风险,所以他们发出这样的倡议并不令人意外。令我感到有些意外的是伊隆·马斯克 (Elon Musk) 也签了名,但他似乎并没有在推特上高调宣传此事。马斯克此前曾表达过对 OpenAI 发展方向的不满,认为其从一个开源非盈利组织转变为闭源盈利组织,并且微软通过投资获得了对 OpenAI 代码库的独家访问权。

面对这封公开信,OpenAI 的 CEO 山姆·奥特曼 (Sam Altman) 则表示,他非常同意信中关于 OpenAI 应该制作并发布良好的比对数据集和评估标准的观点。他多次强调”对齐”(alignment) 的重要性,即确保 AI 模型的目标与人类用户的目标和价值观保持一致。

AI大事件2023 的反思与展望

回顾 2023 年 3 月那段风起云涌的日子,一系列AI大事件2023接踵而至,令人应接不暇。从 ChatGPT API 的发布到 GPT-4 的惊艳亮相,从各种 AI 应用的井喷到关于 AI 风险的激烈讨论,我们共同见证了人工智能发展史上的一个重要转折点。这些事件不仅展示了 AI 技术的巨大潜力,也暴露了其发展过程中面临的挑战和争议。

全局性核心要点总结

2023 年 3 月的 AI 发展浪潮,给我留下了几个核心的印象。首先,AI 技术的迭代速度远超想象,新模型、新应用的发布节奏令人目不暇接。其次,AI 的能力边界在不断拓展,从文本生成到图像理解、视频创作乃至代码编写,其多模态和泛化能力日益增强。再次,AI 正以前所未有的深度和广度融入生产力工具和日常应用,预示着一场深刻的生产力变革。然而,伴随技术飞跃的,是关于伦理、安全和就业等问题的激烈讨论,如何在创新与规范之间取得平衡,成为全社会面临的共同课题。最后,全球科技巨头和初创企业在 AI 领域的竞争日趋白热化,这种竞争既是技术进步的催化剂,也可能加剧某些潜在风险。

独特深度洞见

我始终认为,压制科技发展并不能真正造福人类,即便科技发展必然伴随着风险。然而,当商业利益成为科技发展的首要驱动力,甚至凌驾于伦理和社会责任之上时,潜在的灾难或许就离我们不远了。2023 年 3 月的种种AI大事件2023,既让我们看到了未来的无限可能,也敲响了警钟:我们需要更智慧、更负责任地引导 AI 的发展方向,确保它最终服务于人类的福祉,而非少数人的利益或不可控的未来。这需要开发者、企业、政策制定者以及公众的共同努力和持续对话。

掌握系统化思维,构建你的AI智能体

工具思维跨越到智能体思维,掌握系统化的方法论与AI智能体构建能力,构建可迁移的AI自动化技能,随时适应新需求!

7 阶实战体系,一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动,效率提升10倍!

◆ 现在订阅,限时享受独家优惠,解锁你的AI竞争优势!



立即开启AI智能体进化之旅 →

Axton二维码

扫码关注获取更多资源

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部