12 月 5 日, 的创始人 Sam 在推特上宣布, 的用户已经突破 100 万人,然而达成这个数据的成就仅仅用了 5 天。
国外、国内用户们都在将自己的问题,和 AI 的答案分享到各大社交平台,在社区网络中立即形成了一传十,十传百这样非常快速的传播。
如拥有巨大流量的马斯克在推特上发布自己与 AI 的问答。
再例如这个 AI 模仿鲁迅的口吻的回答,也有点那么回事。
我们看到关于 的微信搜索指数在近几天飙升, 当前的国内外热潮,颇有点当年 4s 面世时,用户拿着手机喊:Siri Siri。
这股风潮已席卷开来,仿佛一夜之间大家都在谈论它,假若你还不了解的话,大概会像下面这幅画中的辛普森一样感到有点“孤独“。马斯克调侃说:“很多人疯狂地陷入了 的循环。”
很多用户对这个产品表示感谢,有用户说刚刚发现 可以创建图表,很酷。甚至 已经成为了他们的智能助手,写代码、做方案、查资料都会向 求教。
还有用户说 特别擅长做老师,几句话就能解释清楚复杂的概念,她已经把搜索引擎甩到了一边,用 AI 来学习编程了。
一、 的技术原理
是一个原型人工智能聊天机器人,专注于可用性和对话。由 开发,采用基于 GPT-3.5 架构的大型语言模型。
简略说是整体技术路线上, 在效果强大的 GPT 3.5 大规模语言模型(LLM,Large Model)基础上,引入“人工标注数据 + 强化学习”(RLHF-,这里所说的人工反馈其实就是人工标注数据)来不断 Fine-tune 预训练语言模型。
主要目的是让 LLM 模型学会理解人类的命令指令的含义(比如给我写一段小作文生成类问题、知识回答类问题、头脑风暴类问题等不同类型的命令),以及让 LLM 学会判断对于给定的 输入指令(用户的问题),什么样的答案是优质的(富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等多种标准)。
我们注意到国外媒体也开始在分析 是否会引发搜索引擎的革命,甚至取代搜索引擎的扛把子谷歌。
那么 能做到取代谷歌吗?
马斯克发出了一个非常关键的问题:与 的单次聊天的平均成本是多少?
的创始人 Sam 在推特上明确回复用户, 的算力成本令人惊掉下巴,免费测试也只是暂时的,未来一定会在某个时刻转为付费服务。
在测试版的免责声明中提到,训练 AI 的数据截止到 2021 年,再往后的事情它并不知道。受制于每次训练 AI 的高昂成本,今天的 虽然在理解用户意图和多轮交流上有显著优化,数据有限的问题仍然没有解决。
成本高昂,数据受限是 当前最大的挑战,现在用户出于免费、新鲜感还会继续使用,但假如将来 不解决前面提到的这几个问题,且还收费,那么在面对免费、数据庞大且实时更新的谷歌,几无还手之力,更别说取代谷歌了。
此外谷歌并不是没有在 AI 领域无所建树,2021 年 5 月,谷歌推出了知名的智能语音 AI 模型 LaMDA,这款 AI 语音聊天工具与人交流特别自然。
关于 LaMDA 还曾发生过一件趣事,一位名叫布莱克·莱莫因(Blake )的谷歌工程师在一份报告中声称,在与谷歌语言模型 LaMDA(谷歌于 2021 年 I/O 大会上推出的一款对话 AI 系统,拥有 1370 亿参数)交谈大半年后,他认定 LaMDA 已经自我觉醒了,产生了意识。这件事曾引起广泛关注。
虽然这位工程师的报告未必可信,但至少说明谷歌在 AI 的研究还是很深入的,只是谷歌没有将 LaMDA 向 C 端用户开放,这样反而让 有了后来者居上的机会,迅速占据了巨大的用户流量。
综上所述,数据就之于 AI,就像石油之于汽车,因为受限的数据且高昂的成本导致 想要在短期内取代谷歌的概率极小,同时若谷歌只是埋头技术开发,容易错失巨大市场。类似当年谷歌最早研究云计算,但云计算服务市场却被亚马逊抢先一步。大船难掉头,希望谷歌勿重蹈覆辙。
发表回复