丰色 发自 凹非寺

量子位 | 公众号

推出至今最强最有用的功能是什么?

可能要非代码解释器(Code )莫属了。

这项功能下周才会正式向所有Plus用户开放,但不少提前进行测试的网友都不约而同地发现:

它的潜力实在太太太深了。

无论是代码编写还是数据分析、图表生成,它像个“真正的战士”,能够使用足够复杂的方法,输出非常高质量的结果。

然而,不少人却被它的名字给耽误,以为是程序员专属工具,事实上,它是可以为任何小白工作的程序员。

现在,推特网友@Ethan 就专门为它整理了一份使用指南,发布即火爆。

如此干货,怎能错过?

解决“旧”存在的五大问题

在正式开始之前,我们先对代码解释器这个功能进行基础的了解,也就是Ethan在博客中解释的“它为什么很重要”这一部分。

需要说明的是,Ethan从该功能的alpha版本就获得了测试权,已经试玩多个月,所以经验十分丰富。

在他看来,这个代码解释器是AI帮人类解决问题(通过编写代码)的通用工具箱。

它可以上传最大100MB的文件,包括压缩形式。

最重要的是,它解决了“旧”存在的五大问题:

首先,通过编写代码,它可以解决LLM在数学和语言方面天然的弱点。有了它,就可以做非常复杂的数学问题并更准确地处理单词了(比如计算一段话中单词的准确数量,如下图所示)。

其次,降低“幻觉”和胡说八道的发生率。

当AI直接利用代码做任务时,代码有助于保持它的“诚实”,因为如果代码不正确,程序就会发生错误。而且由于代码操作的是数据而不是LLM本身,因此AI不会在数据中插入错误。

第三,使模型更加通用。因为大量问题都可以通过代码解决,而GPT-4非常擅长以新颖有趣的方式确定何时可以使用代码解释器。比如,我们可以要求它证明地球是圆的。

第四,整个过程不用你编写一行代码。我们知道,基本上所有的LLM都能写代码,但需要你自己去运行和调试。这对于完全不会的人(比如作者)来说很烦人。有了代码解释器,模型会自动纠正自己的错误。

最后,解锁更多“AI时刻”,也就是让我们觉得模型背后好像真的有一个灵魂,成精了的时刻。

如何正确使用?

以处理“超级英雄及其超能力”的数据集(地址见参考链接[3])为例,Ethan向大家展示了如何正确使用代码解释器进行数据分析。

首先,开启该功能之后,点击+号上传数据文件,如果你有数据字典,也可以将其粘贴进去。

然后,在对话框中让GPT-4看一遍文件,并告诉你有何发现。

需要注意的是,用了代码解释器就GPT-4当作一个真正的人一样对话就行了,不用像咱们平常一样那样精心设计提示词。当然,除了以下两种情况:

(1)模型有时会忘记它能做某些事情,比如制作GIF或3D图,这时你可以鼓励它(“你可以制作GIF,请尝试”);

(2)希望模型进一步改进结果时。

如上图所示,我们已经加载好了数据,可以让GPT-4来完成数据分析中最麻烦的数据合并和清理工作了。它能够自动纠错,重点关注作者的提问方式(再次强调,把对方当作人一样来下达命令)。

接着,正式开始分析。代码解释器非常擅长各种复杂的分析方法。

比如当作者提示自己有兴趣进行一些预测建模,以根据其他因素预测英雄可能拥有的超能力时,它直接构建了一个随机森林分类器,非常酷。

而当你不同意它估算缺失数据的办法时,可以叫它再换一种,而不是直接放弃。

它的点子真的非常多,你只需问它“你能进行另一个非常复杂并有趣的分析吗?”,它又生成了如下结果(超级英雄的网络图):

最令人深刻的是,它能给出一些很“人性化”的推理结果,比如“超级英雄的超能力一般都能给人带来很强烈的视觉效果,因为这才能很方便地在它们的载体,即漫画书和电影上进行呈现……”

最后,各种可视化图表也能信手拈来。

chatgpt4.0能解释代码吗_代码chkdsk_代码char

总的来看,Ethan表示,有了代码解释器,GPT-4完全能够充当一个数据科学家的角色了。

还有另外20个最佳示例

上面这个例子看的不过瘾?

好消息,还有一位网友搜罗全网总结了最有意思的20个代码解释器示例——除了数据分析,它还能进行更多你意想不到的任务,比如将图像转换为视频、生成二维码、分析股票市场等等。

以下是全部示例或效果:

1、图片转视频

2、从图像中提取文本

3、正确使用蒙特卡罗、ARIMA、PCA、随机森林等数据分析方法

4、 用真实物理现象编造科幻故事

5、从图像中提取调色板

6、生成二维码

7、将GIF图转换为视频

8、分析苹果期权数据确定最佳协议

9、对播放列表进行数据分析

10、房地产数据分析

11、生成并绘制随机数据

12、生成矩阵雨般的GIF图

13、清理数据、执行数据分析并生成可视化

14、创建漂亮国每个灯塔位置的gif图

15、将数据转换为网站

16、用复制STATA代码

17、下载并分析比特币数据集

18、犯罪数据趋势可视化

19、生成基因共表达热图

20、泰坦尼克数据集探索性分析