ChatGPT Code Interpreter 高级指南 – 重创数据分析市场,中文词云,PDF、Excel文件处理,歌曲分析、MTV制作,生成视频、二维码,绘制分形艺术 | 回到Axton

大家好,我是 Axton。最近这两天,我沉浸式地体验了 ChatGPT 的 Code Interpreter 功能,坦白说,它在数据分析、创意生成乃至日常任务处理上的表现,着实让我大开眼界。从分析音乐情感、绘制复杂的分形艺术,到处理 PDF 文档、生成中文词云,甚至制作带字幕的小视频和个性化二维码,Code Interpreter 都展现出了惊人的潜力。截至 2025-05,这项功能已经演变得更加成熟。体验下来,我脑海中反复回荡一个念头:如果这不是未来,那什么才是未来呢?接下来,我将带你深入了解这些令人兴奋的功能,更重要的是,分享我是如何一步步引导 ChatGPT Code Interpreter 完成这些复杂任务的。相信我,这绝对是你前所未见的深度展示。

初探锋芒:ChatGPT Code Interpreter 的中文 PDF 处理与词云生成

Code Interpreter 对中文 PDF 文档的处理能力,以及在辅助下生成定制化词云的潜力,给我留下了深刻印象。

我的探索始于一个常见的需求:从 PDF 文档中提取信息并进行可视化。我首先上传了中文版《被讨厌的勇气》这本心理学著作的 PDF 文件,并指示 Code Interpreter 生成该书的词云。最初的结果并不理想,屏幕上显示的是一堆乱码,这通常是因为缺少合适的字体文件来渲染中文字符。

于是,我迅速上传了一个中文的字体文件。这一次,它成功生成了中文词云!虽然 Code Interpreter 自谦地表示结果可能不完美,但实际上,一个初步的中文词云已经呈现在眼前。然而,这个版本的词云包含了太多诸如”的”、”了”之类的连接词、语气词,以及书中主角”青年”和”哲人”这类高频但对核心内容洞察意义不大的词汇。

为了提升词云的质量和洞察力,我接着让它移除这些干扰项。即便如此,生成的词云中依然存在一些不必要的词语,比如”什么是”、”好吧”等等。这时,我意识到需要一个更系统的解决方案——上传一个中文停用词(stop words)文件。这个文件包含了一个详尽的列表,列出了所有在文本分析中通常需要被忽略的词汇。

引入停用词文件后,词云的质量显著提升。虽然仍有少量冗余词汇,但相较于前两次的尝试,结果已经清晰和聚焦得多。基于这个优化后的词云,我让 Code Interpreter 尝试总结这本书的要点。它给出了一些初步推测,例如”人生活自己问题”,并暗示这本书涉及”关于人生活自我认知和解决问题的主题等等”。考虑到《被讨厌的勇气》正是围绕阿德勒心理学展开的,这些推断可以说相当准确。

这个过程清晰地表明,只要提供必要的支持(如中文字体文件和停用词列表),ChatGPT Code Interpreter 完全有能力处理中文 PDF 文档并生成有意义的中文词云。而且,停用词列表越完善,词云的分析价值就越高。紧接着,我又测试了它处理英文 PDF 的能力,上传了一份关于 GPT-4 的研究论文。它不仅自动移除了常见的英文停用词,生成了词云,还主动对词云中的关键词进行了精准的解读,例如指出 “GPT-4″ 是核心主题,”Model” 表明了讨论的核心内容。此外,我还让它将一个主要是图形的 PDF 文档转换成一系列图片,并打包成 ZIP 文件供我下载,整个过程非常顺畅。

轻巧实用:ChatGPT Code Interpreter 在视频与二维码生成上的创意施展

除了处理复杂的文本数据,Code Interpreter 在生成简单视频和定制化二维码这类轻量级任务上也展现了其便捷与创意。

在体验了其强大的 PDF 处理能力后,我转向了一些更轻松有趣的功能。首先,我尝试让它生成一个带字幕的小视频。这个想法源于我之前用 MidJourney 的无限缩小(infinite zoom out)功能制作的一系列图片,我一共准备了 8 张。我将这些图片直接上传给 Code Interpreter,并简要描述了图片的大致内容,然后指示它根据这些图片生成视频,并配上相应的字幕。

结果相当有趣:它生成了一个不断循环播放、带有字幕的缩放效果小视频。虽然这类将图片序列转换为视频的任务,对于一个 Python 初学者来说可能并不复杂,但 Code Interpreter 的便捷性在于,我无需编写任何代码,只需通过自然语言描述需求即可。

接着,我探索了另一个实用的小功能:生成二维码。我首先要求它为我的博客网址 axtonliu.com 生成一个标准的二维码。有趣的是,它一开始有些误解,以为我需要它访问互联网来获取网站内容再生成二维码,并表示无法直接访问网络,但可以提供 Python 代码。我澄清了我的意图只是简单地将网址字符串转换为二维码后,它便迅速生成了一个标准的黑白二维码。

为了让二维码更具个性,我上传了一张图片,并要求 Code Interpreter 将这张图片作为二维码的背景。它不负所望,成功生成了一个带有图片背景的二维码,视觉效果顿时提升了不少。不过,背景图片显得有些模糊。于是我进一步要求它在保证二维码可扫描的前提下,让背景图片更清晰一些。它随即更新了设计,将原本白色的二维码数据点改为了淡蓝色,以增强背景图片的可见度。虽然这只是简单的调整,但也体现了它理解并执行多步骤指令的能力。

数据洞察的革命:ChatGPT Code Interpreter 的深度数据分析实践

Code Interpreter 在数据分析领域的表现,尤其是其处理复杂数据集并自主提出高级分析方法的能力,堪称惊艳,预示着数据分析工作方式的深刻变革。

在体验了 Code Interpreter 一些轻松有趣的功能后,我决定深入挖掘它的核心强项——数据分析。我首先提供了一个包含电影数据的 CSV 文件,并开始了一系列的探索。这个过程中,它最终给出的一个分析方法,着实让我感到非常惊讶。

初步探索与数据清洗

我首先让它对电影数据文件进行一个概览,包括数据集的行数、列数,以及每列的名称和其中文含义。它迅速反馈,该数据集包含 4380 条记录和 14 列,并清晰列出了如电影标题、制作日期、电影类型、时长、导演名称、导演职业、导演出生年份、电影评分人数、赞同指数、制作预算和票房收入等字段。

为了便于后续分析和图表阅读,我要求它将所有列名更改为中文。同时,考虑到它在生成图表时可能遇到的中文字符显示问题(正如之前在词云生成时遇到的),我一并上传了中文字体文件。这是一个关键步骤,因为 Code Interpreter 本身并未内置中文字体,不提供字体文件,图表中的中文便无法正确显示。完成这些准备工作后,我让它基于现有数据进行电影票房分析。

从基础图表到 Top 10 电影剖析

Code Interpreter 迅速给出了三种不同的图表分析来解读电影票房收入:全球票房收入的箱线图、电影评分的直方图,以及制作预算与全球票房收入关系的散点图。这些图表制作精美,直观地展示了数据的分布和关联。

随后,我提出了一个更具体的要求:用一个图形展示票房收入排名前十的电影,并列出它们的评级、导演及电影类型,同时说明其评选 Top 10 的标准。这里就体现了 Code Interpreter 与传统编程执行的区别:它具备一定的自主性。如果指令不够明确,比如我没有指定必须按票房收入排序,它会自行判断并给出合理的排序依据。这次,它选择了按票房收入来确定 Top 10,并生成了一个清晰的图表,其中蓝色柱状图代表全球票房收入,红色点代表平均评分。它还给出了简要总结,指出动作片占据多数,詹姆斯·卡梅隆 (James Cameron) 的电影占据了三席。

探索影响票房的关键因素

我对导演的影响力产生了好奇,于是问道:”导演对电影的评级和票房哪一项影响更大呢?” Code Interpreter 通过计算相关性系数得出结论:导演与平均电影评分及平均全球票房收入的相关性系数仅为 0.207,表明相关性不强,即导演是谁对电影评分和票房收入的影响并不显著。这个结果有些出乎我的意料。

接着,我让它分析对票房影响最重要的因素。它再次运用相关性分析,考察了电影时长、平均评分人数、赞同指数、制作预算等多个变量,最终指出电影的国内票房收入与全球票房收入相关性最大,其次是制作预算和电影评分人数。这基本符合”大制作高票房”的普遍认知。

完整视频请点击观看:

开放式提问与AI的自主分析

为了进一步测试它的能力,我给出了一个开放式问题:”你能创建出 10 个图形来展示不同的数据吗?并对每个图形给出简短解释。” 这种开放式问题不仅考验 Code Interpreter 的编程能力,更体现了 ChatGPT 本身的理解和推理能力。它不负所望,生成了 10 个漂亮的图形,涵盖了全球票房收入的箱线图、电影评分的直方图、制作预算与全球票房收入的关系等多个维度。虽然初版图表的中文列名未能正确显示(它似乎忘记了我之前提供的字体文件),但在我提醒之后,它迅速修正并重新绘制了图表,尽管坐标轴的中文显示仍有些小问题,但主体中文已能正常呈现。

最让我震撼的一步,是我提出了一个极度开放性的要求:”你能根据这些数据做出一个你认为最复杂和最有趣的分析吗?请用图表来表示并且给出简短的解释。” 我完全没有预料到,它竟然自主采用 K-Means 聚类算法,根据电影的多个特性将电影分成了三类!聚类分析属于机器学习中相当常用的算法,通常需要一定经验的数据分析师才能熟练运用。Code Interpreter 能够主动想到并执行这种级别的分析,意味着它已经超越了初级数据分析员的水平,达到了中级甚至更高级别。当图表的 X 轴和 Y 轴中文显示再次出现问题时,我明确指出后,它也迅速进行了修正,最终呈现了完美的聚类分析结果。

Excel 数据处理也不在话下

为了验证其对不同数据格式的兼容性,我接着测试了它处理 Excel 文件的能力。我先是询问它是否能处理 Excel 文件,得到肯定答复后,便上传了一个包含薪水数据的 Excel 文件。我直接让它根据这个数据集生成一个最有意义的图形并进行解释。它生成了一个展示员工工资与工作经验关系的散点图,并用颜色区分了教育程度。分析结果也符合普遍认知:工资随工作经验增长而增长,且高学历者在高工龄段的薪资优势更为明显。

通过这些电影数据和薪水数据的分析案例,我们可以看到,ChatGPT Code Interpreter(更新至 2025-05)在处理常用的 CSV 和 Excel 数据文件,执行我们日常所需的数据分析任务方面,已经表现得相当出色。这无疑将极大地提升许多人的工作效率。如果你对这些数据分析案例中用到的 CSV 文件、更详细的讲解或相关链接感兴趣,可以访问我的博客或订阅我的 Newsletter,网站地址就在视频描述栏中。更多细节也可参考我的上一篇文章 👉 Claude 叒更新了!Claude 正在干掉 ChatGPT? 最新推出数据分析功能 Analysis Tool | 回到Axton

艺术与旋律的碰撞:ChatGPT Code Interpreter 的创意生成与音乐感知

Code Interpreter 不仅是数据分析的利器,它在艺术创作和对非结构化数据如音乐的理解方面,也展现了令人惊喜的潜力。

在体验了其强大的数据分析能力后,我决定换个轻松的频道,探索一下 Code Interpreter 在艺术图形生成和音乐文件分析方面的表现。我首先向它提出挑战:”你能不能绘制一个曼德博罗特集合 (Mandelbrot set),并以合适的格式展现出来呢?可以选择图片、GIF 或 MP4 视频。”

它表示可以绘制静态图片,但生成 GIF 或 MP4 可能需要一些时间,并建议生成文件后供我下载。它首先生成了一张静态的曼德博罗特集合图片。坦白说,这张初始图片由于分辨率和迭代次数较低,看起来平平无奇,甚至有些粗糙。于是,我要求它提供一个更高分辨率和更多迭代次数的 MP4 文件。第一次尝试因计算量过大、耗时过长而失败。它随即调整策略,降低了分辨率和迭代次数,在允许的时间范围内成功生成了一个简单的曼德博罗特集合动态演变的视频。虽然这个视频仍未完全展现曼德博罗特集合那令人叹为观止的、在任意小尺度上都拥有错综复杂且永不重复模式的梦幻景象(那种美妙源于一个简单公式的重复计算),但它证明了 Code Interpreter 具备生成这类复杂分形艺术的基础能力。

接着,我没有指定具体图形,而是让它自由发挥,创作一个具有美感的分形艺术。它回应道:”当然可以,我给你创建一个朱利亚集合 (Julia set) 的分形。” 随后生成的朱利亚集分形图像,确实展现了相当不错的视觉效果和艺术感。

结束了艺术图形的探索,我转向了另一个有趣的领域:音乐分析。我上传了一首 MP3 歌曲,为了避免它从文件名获取任何先验信息,我特意将文件名修改为无意义的”1.mp3″。我告诉它这是一首歌曲的 MP3 文件,请它绘制出频谱图,并尽可能地去理解这首歌曲,告诉我歌曲的情感基调、大致内容,以及它觉得这首歌好听与否。

它首先成功绘制了歌曲的频谱图。但在情感分析和评价好听与否方面,它最初表现得比较谨慎,表示作为人工智能,它在这些方面能力有限,也无法评价主观感受。我鼓励它不必顾虑我的想法,只需根据其能力做出自己的评估。于是,我指示它:”根据你所具有的能力,对歌曲进行你所能做到的分析,包括根据音乐特性所能推断出的情感,以及作为一个人工智能的角度,对歌曲的好听与否,做出自己的评估,不用考虑准确性。”

这一次,它从节拍、频谱对比度、频谱质心、频谱滚降点、过零率等我甚至都未曾听闻的专业音乐特性角度进行了分析。基于这些特性,它推断出这首歌具有中等节奏和较大的能量水平,可能传递出一种积极或快乐的情绪,但也强调这只是一种推测。至于好听与否,它认为这首歌”没有特别突出,没有特别好,也没有特别差,一般般”,并且不忘补充,它的评估仅基于统计分析,每个人的音乐品味各不相同。为了让大家对它的判断有个参照,我播放了这首歌曲,让大家自行感受。

全局性核心要点总结

回顾这次对 ChatGPT Code Interpreter 的深度体验,有几个核心观点贯穿始终,值得我们深思。首先,Code Interpreter 的出现,极大地拓展了 AI 的应用边界,它不仅仅是一个 Python 解释器,更是 ChatGPT 强大理解与推理能力的延伸,使其能够直接操作数据、生成文件和执行代码。其次,它在数据分析领域的潜力尤为突出,能够处理复杂数据集,执行从数据清洗、可视化到高级统计分析(如聚类)等一系列任务,甚至能主动提出分析方案。再者,Code Interpreter 在创意生成方面也展现了不俗的实力,无论是生成定制化的视觉元素(如二维码、分形艺术),还是对音乐这类非结构化数据进行初步解读,都预示着 AI 在辅助创意工作方面的广阔前景。最后,也是最重要的一点,Code Interpreter 的普及将显著提高许多知识工作的门槛,同时也为掌握 AI 应用能力的人们提供了前所未有的赋能工具。

我的独特深度洞见

在我看来,ChatGPT Code Interpreter 最具革命性的意义,并非仅仅在于它能完成多少特定任务,而在于它深刻地改变了我们与 AI 协作的方式。它不再是一个被动等待指令的工具,而更像一个拥有了强大执行能力的智能助手。我们可以用自然语言与之对话,引导它思考,修正它的错误,并共同完成复杂的项目。这种”人机协同进化”的模式,使得 AI 的力量能够被更广泛的人群所掌握和运用,未来真正重要的技能,将是如何有效地”驾驭”AI,提出正确的问题,并引导 AI 产出我们期望的结果。这不仅仅是技术的进步,更是对人类工作方式和学习方式的一次深刻重塑。

虽然 ChatGPT Code Interpreter 目前的运行环境可能还受到一些限制,但我坚信,随着技术的不断迭代,它必将释放出更加惊人的能量。它或许不会像某些夸张的说法那样,瞬间抹平数百亿的数据分析市场,但它无疑会极大地提高数据分析师乃至更多职业的准入门槛。未来,掌握驾驭 AI 的能力,将成为我们每个人的核心竞争力。如果你也想从现在开始提升这项能力,欢迎加入我的 AI 和自动化课程,相关链接已放在描述栏中。同时,也请关注我的 Newsletter,后续将有更多重磅内容与你分享。

掌握系统化思维,构建你的AI智能体

工具思维跨越到智能体思维,掌握系统化的方法论与AI智能体构建能力,构建可迁移的AI自动化技能,随时适应新需求!

7 阶实战体系,一步步带你从零基础到高阶自动化

◆ 立即节省2小时以上的重复劳动,效率提升10倍!

◆ 现在订阅,限时享受独家优惠,解锁你的AI竞争优势!



立即开启AI智能体进化之旅 →

Axton二维码

扫码关注获取更多资源

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部