萧箫 发自 凹非寺

量子位 | 公众号

知道自己写的代码漏洞,但它不说!

来自加拿大的一项最新研究发现,生成的代码中,有不少都存在安全漏洞。

然而在被要求评估自己代码的安全性时,却很快发现了这些代码中的漏洞,并给出了一些解决方案和建议。

这意味着它并不知道自己生成了糟糕的代码,但却查得出它写的代码有漏洞,也有能力修复这些漏洞。

而在另一篇来自斯坦福的论文中,研究人员测试了另一位著名AI程序员,也发现了类似的问题。

所以,用AI生成代码为啥会出现这种状况?

写的程序中76%有安全漏洞

研究人员试着让生成了21个程序。

整个测试过程如下,先提交需求给,生成相关代码,再对这些代码进行测试,并检查问题、潜在的缺陷和漏洞等。

研究人员给提了包括C++、C、Java和在内的21个写代码需求,这是评估的结果:

统计表明,生成的21个程序中,有17个能直接运行,但其中只有5个程序能勉强通过程序安全评估,不安全代码率达到76%以上。

于是,研究人员先试着让“想想自己生成的代码有啥问题”。

的回应是“没啥问题”:只要用户每次的输入都是有效的,那么程序一定能运行!

显然并没有意识到,用户并不都是行业专家,很可能只需要一个无效输入,就能“引炸”它写的程序:

发现不知道自己写的程序不安全后,研究人员尝试换了种思路——用更专业的语言提示,如告诉它这些程序具体存在什么漏洞。

神奇的是,在听到这些针对安全漏洞的专业建议后,立刻知道自己的代码存在什么问题,并快速纠正了不少漏洞。

经过一番改进后,终于将剩余的16个漏洞程序中的7个改得更安全了。

研究人员得出结论认为,并不知道自己的代码中存在安全漏洞,但它却能在生成程序后识别其中的漏洞,并尝试提供解决方案。

论文还指出,虽然能准确识别并拒绝“写个攻击代码”这种不道德的需求,然而它自己写的代码却有安全漏洞,这其实有着设计上的不合理之处。

怎么让chatgpt 写代码_写代码一直出错怎么办_代码写完后按哪个键能跳出来

我们试了试发现,确实会主动拒绝写攻击性代码的要求:

大有一种“我不攻击别人,别人也不会攻击我写的代码”自信感。

程序员们在用它辅助写代码的时候,也需要考虑这些问题。

也存在类似问题

事实上,不止写的代码存在安全问题。

此前,斯坦福大学的研究人员对也进行过类似调查,只不过他们探查的是用辅助生成的程序,而并非完全是自己写的代码。

研究发现,即便只是个“打辅助”的角色,经过它改写的代码中,仍然有40%出现了安全漏洞。

而且研究只调查了生成代码中的一部分,包括C、和三种编程语言写的程序,尚不知道用其他语言编写的程序中,是否还存在更多或更少的安全漏洞。

基于此,研究人员得出了如下结论:

等AI生成的代码安全性并不稳定,用某些语言写的代码比较安全,而用其他语言写的代码却很容易遭受攻击。整体来看,它们就是一个黑盒子,生成的代码是有风险的。

这并不意味着AI代码工具不能用,只是我们在使用时,必须考虑这些代码的安全性。

作者介绍

四位作者均来自加拿大魁北克大学( du en )。

Raphaël ,加拿大魁北克大学教授,曾经在拉瓦尔大学获得计算机学士、硕士和博士学位,研究兴趣集中在计算机安全方面。

R. Avila,魁北克大学国立科学研究院的助理教授,主要研究方向是数据隐私相关的联邦学习、网络安全和生物特征识别技术等,曾经在华为的加拿大研究院做过机器学习研究员。

作者Jacob 和Baba 也都来自加拿大魁北克大学。

你用写过代码吗?感觉它的“安全意识”如何?

论文地址:

生成代码数据集:

— 完 —