嘿,我是 Axton!最近人工智能(AI)的浪潮真是席卷了整个互联网,尤其是 ChatGPT 的横空出世,更是让大家对 AI 的能力边界充满了好奇。它究竟发展到了什么程度?又能为我们做些什么呢?如果你也有同样的疑问,那么恭喜你,来对地方了!在这篇文章里,我会和大家聊聊 AI 领域最近两个激动人心的新闻,并毫无保留地分享三个我压箱底的 AI 网站。它们将极大地提升你利用 AI 处理工作、提高效率的能力。
AI 前沿速递:从 ChatGPT 升级到谷歌音乐黑科技
最近,AI 领域最耀眼的明星莫过于 ChatGPT 的再次升级,这次它着重提升了事实性和数学能力。
熟悉 ChatGPT 的朋友可能知道,它之前在数学计算方面确实有些不尽如人意,甚至有时会一本正经地”胡说八道”。我个人就曾见识过它这种令人啼笑皆非的时刻。因此,这次针对事实性和数学能力的升级,可以说是非常精准和必要的。至于升级后的具体表现如何,我会在这篇文章的末尾部分,通过一个快速测试来向大家展示。
与此同时,科技巨头谷歌也没闲着,他们最近发表的一篇关于文本生成音乐的论文同样令人瞩目。
我们可能已经对 AI 通过文本生成语音、图片,甚至是一些相对简单的视频习以为常了。但是,用文本来直接生成音乐,这听起来是不是就酷炫多了?我特地去查阅了谷歌研究院发布的这篇名为 MusicLM 的论文。虽然目前这还只是一个研究项目,没有开放给公众使用的应用,但它展示的能力已经相当惊人。
音乐创作的未来:MusicLM 的”故事模式”
MusicLM 不仅能通过字幕生成音频,还能根据图画及其说明创作出与画面意境相符的音乐。最让我感到兴奋的是它的”故事模式”(story mode)。想象一下,你只需要提供一系列的文本提示,描述一个故事情景,AI 就能为你谱写出与之匹配的背景音乐。论文中有一个一分钟的演示音频,它根据”冥想时间”(0-15秒)、”起床时刻”(15-30秒)、”跑步时间”(30-45秒)以及最后的”工作时间”(45-60秒)这四个阶段的文字描述,生成了一段连贯且富有情境感的音乐。为了让大家有更直观的感受,我还特意为这段音乐配上了相应的画面,效果相当不错。
AI 工具箱:释放你的创作潜能
在深入探讨更多 AI 应用之前,我必须声明,我与接下来要介绍的所有网站都没有任何商业合作关系,纯粹是因为我在使用过程中觉得它们非常实用,希望能分享给大家,帮助各位更好地驾驭 AI。自从 ChatGPT 火了之后,市面上涌现了大量的 AI 网站和工具,我试用过不少,但坦白说,其中超过九成的工具并没有太大的实际意义。我分享的,都是经过我粗略筛选后,认为要么对我们有实际用途,要么能在思路上给我们带来启发的。
我们都知道,要想让 AI 高效地为我们服务,关键在于提供高质量的指令(Prompt)。
你给 AI 一个清晰、具体的问题或指令,它才能反馈给你一个高质量的回答或成果。那么,如何才能写出优秀的 Prompt 呢?这本身就是一个值得研究的课题。
Midjourney Prompt Helper:你的专属绘画指令优化师
第一个要分享的,是一款能帮你优化 Midjourney 绘画指令的利器——Midjourney Prompt Helper。
在接触这个工具之前,我尝试过用中文指令让 Midjourney 作画,比如”公主在森林城堡中”。但实际效果非常不理想,生成的图片几乎与描述毫无关联,尤其是第四张图,简直是风马牛不相及。很多初学者,包括我自己刚开始时,可能都只是简单地用英文描述想要的画面,比如把”公主在森林城堡中”翻译成 “Princess in a forest castle”。虽然直接这样输入,Midjourney 有时也能画出不错的作品,但其实它支持非常多的参数和属性,可以创作出风格迥异的画作。
这个 Midjourney Prompt Helper 工具就是为了帮助我们更好地运用这些参数。我们还是用”公主在森林城堡中”作为基础指令。首先,我们可以选择绘画的风格(style),它提供了从像素风(8-bit, 16-bit)到赛博朋克(cyberpunk)等多种选择。我尝试选择了赛博朋克风格,想看看这样的公主和城堡会是什么样子。接着,我还调整了光线效果(lighting),选择了背光(backlight);镜头方面,我选用了望远镜头(telephoto lens)。此外,还可以选择艺术家的风格、颜色、材质、图片比例、景深等等。完成这些选择后,工具会自动生成一个包含所有参数的完整 Prompt。我将这个 Prompt 复制粘贴到 Midjourney 中,它生成的赛博朋克风、背光、望远镜头下的公主森林城堡图,效果相当独特。需要注意的是,这个工具目前支持的 Midjourney 版本最高到 V3,而我们现在常用的 Discord 版本已经是 V4 或更高,所以有时生成的指令可能需要微调一下。
我还尝试了另一种风格,取消了大部分镜头和光线参数,转而选择了一位艺术家的风格——梵高(Van Gogh)。生成的图片确实带有一些梵高式的笔触和色彩感。更有趣的是,这个工具还允许你上传一张图片,它会尝试生成与上传图片风格近似的 Prompt。我上传了一张可爱小猫的图片和一张科幻风格的图片,然后让它结合”公主在森林城堡中”的主题进行创作,生成的结果也颇具特色。我相信,当你熟悉了这些指令和参数后,就能更轻松地创作出符合你脑海中想象的画面了。
Awesome ChatGPT Prompts:你的 ChatGPT 指令灵感库
接下来这个网站 Awesome ChatGPT Prompts,则是一个针对 ChatGPT 的高质量指令(Prompt)宝库。
在我看过的众多类似 Prompt 集合中,这个网站的内容质量是相当不错的。它收集了各种各样场景下的优秀 Prompt。你可以在网页上搜索你需要的 Prompt 类型。比如,我想让 ChatGPT 扮演一位影评人。我找到了对应的 Prompt:”Act as a film critic”。
这个 Prompt 的主体部分是固定的,你需要修改的是最后一句,通常在两个引号之间的部分。例如,它预设的是评论电影《星际穿越》(Interstellar)。你可以把它改成任何你想评论的电影,比如《满江红》或者《流浪地球》。修改完毕后,点击旁边的剪刀图标,就能将整个 Prompt 复制到剪贴板,然后粘贴到 ChatGPT 中即可。我注意到,这个影评人 Prompt 写得非常详细,它会提示 ChatGPT 从多个角度进行评论,并且要避免剧透。当我用这个 Prompt 让 ChatGPT 写一篇关于《星际穿越》的影评时,它给出的回答内容详实,逻辑清晰,远比简单地问”请写一篇《星际穿越》的影评”要好得多。这再次印证了,要想从 AI 那里得到好的结果,你的指令也必须尽可能细致,明确你的要求和期望达到的程度。
AI 工具聚合平台:探索 AI 应用的无限可能
最后要介绍的这个网站,更像是一个 AI 工具和服务的导航站,它汇集了众多 AI 应用,让你一览众山小。
这个网站类似于我之前视频中介绍过的,可以帮助你产生 AI 创意点子的平台。它收集了五花八门的 AI 工具和服务,你可以通过浏览这些工具,了解别人都在用 AI 做什么。很多时候,我们可能并不清楚 AI 究竟能在哪些方面给我们带来实质性的帮助,或者我们能用 AI 来做些什么特别的事情。但是,通过不断地观察和参考别人的实践,往往能激发我们自己的创意灵感。这也是我非常喜欢浏览这类聚合平台的原因。
完整视频请点击观看:
AI 渗透生活:医疗领域的惊人进展
除了这些令人兴奋的工具,AI 在专业领域的渗透也达到了新的高度,尤其是在医疗行业。
最近我在 Twitter 上看到一个非常引人注目的消息:ChatGPT 上周竟然通过了美国的医疗执照考试!紧接着,一个名为 Glass AI 的网站也进入了我的视线。这个平台宣称可以根据用户对自己状况的描述,来生成鉴别诊断和临床计划。这听起来相当不可思议,也预示着 AI 未来在医疗领域将能为人类带来巨大的便利。当然,该网站也明确指出,它目前并非面向普通大众,而是供医务工作者参考和学习使用,其提供的任何建议都不能替代专业的医疗意见。但无论如何,这些进展都让我们深刻感受到,AI 正在以前所未有的速度渗透到我们生活的方方面面。
实测升级版 ChatGPT:数学能力究竟如何?
当然,对于 ChatGPT 的升级,我最直观的感受还是想亲自测试一下它的数学能力。
由于时间有限,我无法全面检测其事实性的突破,所以重点放在了数学运算上。首先,升级后最明显的”感受”反而是网站变得更难用了,我猜测可能是因为升级吸引了大量用户尝鲜,导致服务器拥堵。在我测试过程中,问了两个问题后,它就直接崩溃了,刷新后才能继续。
除了像”二加二等于几”这类简单问题,我还给它出了一道经典的”鸡兔同笼”问题。它给出的推导过程大体上是正确的,但最后却莫名其妙地得出了一个”二十等于二十八”的结论。当我追问最终答案时,它回答说无法确定鸡和兔的具体数量。于是,我再次提示它”这是可以算出来的”。这一次,它终于算出了正确的结果。由于我之前没有系统地测试过它的数学能力,所以无法准确判断这次升级带来的提升幅度有多大。但总的来说,我其实更希望它能提升服务器的容量和稳定性,因为随着用户越来越多,它的响应速度明显变慢,也更容易掉线。
全局性核心要点总结
通过最近的这些观察和体验,我深刻感受到 AI 发展的迅猛势头。首先,无论是 ChatGPT 的迭代升级,还是谷歌在音乐生成领域的探索,都标志着 AI 的能力边界在不断拓展,尤其是在理解和创造层面。其次,高效使用 AI 的关键在于学会提问,也就是构建高质量的 Prompt,这直接决定了 AI 输出成果的质量。再者,AI 的应用场景正在从通用领域向专业领域深度渗透,例如医疗行业,这预示着 AI 将在更多垂直行业发挥重要作用。最后,积极拥抱和探索层出不穷的 AI 工具和服务,不仅能提升我们的工作效率,更能激发我们的创新思维。
独特深度洞见
我认为,当前 AI 的发展,尤其是像 ChatGPT 这类生成式 AI 的普及,正在悄然改变我们与技术的关系。我们不再仅仅是技术的使用者,更像是与 AI 并肩作战的”协作者”或”引导者”。未来,衡量一个人能力的标准,可能不再仅仅是他掌握了多少知识或技能,更重要的是他能否有效地利用 AI 作为强大的外部大脑和执行工具,去解决更复杂的问题,创造更大的价值。这种人机协作能力的培养,或许是我们每个人都需要思考和实践的新课题。