记者|陈冰
中国农历新年刚过,一款号称史上最强的聊天机器人 迅速火出了圈。似乎一夜之间,所有人都在玩,聊人工智能。
伴随着的高速发展,很多公司和个人的命运将会完全被改写。这是不亚于蒸汽机、铁路、电报、互联网的时代巨浪,以为代表的AI自生成技术,让人工智能实现了从感知理解世界到生成创造世界的巨大跃迁。微软CEO纳德拉甚至认为对于知识型工作者来说,这就完全等于工业革命。
程序员曾经被认为是最难自动化的知识工作,而现在,一切都变了。一位IT行业的老炮在见识了的编程能力之后,还是不禁发出感慨:“本以为不会有太多惊喜,没成想,还是吓了一跳。”在评测文章中,他还表示这一切既令人着迷,又令人惊讶,同时还令他恐惧。
毫无疑问,生成式人工智能是自移动和云计算兴起以来最引人注目的突破式技术,这种具有颠覆性的变革,将会成为数十亿人日常生活的一部分。如果说互联网引发空间革命,手机引发时间革命,那么,将引发“思维革命”:它改变了人类思考和处理问题的方式,并由此重塑世界!
新时代的大幕,已徐徐拉开。
什么是?
(Chat Pre- ,聊天生成式预训练转换器)是人工智能公司开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列任务,因此有望成为提高办公、学习效率的工具。
这款AI语言模型让撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,甚至敲代码、检查程序错误都变得易如反掌。不少和“聊过天”的网友纷纷感叹,“只有你想不到,没有办不成的”。
这种革命性的颠覆,让一众叱咤风云的互联网公司也明显感受到了问题的急迫性。
#让苹果急了#
#美国89%的大学生都是用做作业#
#多家学术期刊禁止将列为合著者#
#马斯克曾称好得吓人#
…………
大家好奇,人工智能也搞了十几年了,AI对话更是没有激起什么水花。无论是微软的小冰,还是苹果的siri还是阿里的天猫精灵,留给大家记忆深处的更多的是一堆“笑柄”。它怎么一下子突然变得这么“聪明”了?
其实说来也简单,如此强大,离不开背后丰富的“知识储备”。
用于训练的数据集至少包含4990亿个token(token为语言中最小的语义单位,在英文中等于一个单词,在中文中等于一个词语),覆盖海量的博客、书籍、新闻资讯、网站内容等。
是如何学习的呢?
首先是AI学习来自网络的文本数据,得出随机答案;然后根据人工标注的问答数据微调模型,使AI一定程度上理解人类的意图,从文字接龙进入引导接龙阶段;再接着,人工对AI生成的结果进行排序,就此数据训练奖惩模型,使AI模仿人类评分标准给不同的回答打分,进入模仿喜好阶段;最后,根据打分更新参数,强化AI学习,训练AI得出高质量回答。说得通俗一点,这类训练就是让AI从人类反馈中强化学习,再用数据重新微调从而使得AI更像人。
其实整个训练过程和教小朋友数学差不多。就是先上课给例题,然后给作业,再针对作业打分后挑出一些总是出错的题目再进行有针对性的练习。最关键的一点是,对于不同的学科和知识点,我们并不需要从头训练一个新模型,之前的机器学习都是这样的,而这一次,人类不再需要含辛茹苦数十载,进行数据训练,只要拿出之前预训练好的模型,给一些指导,一个新技能就get了。
眼下,正在通过和全球上亿用户的互动,不断增强自身的能力。如果说以谷歌、百度为代表的搜索引擎在“寻找问题的答案”,那么就是直接跨越到了“自主完成任务”。
程序员用它生成代码,公务员用它生成报告,设计师用它一键生成设计草图、图标;营销人员用它生成竞品分析,撰写经营报告以及其他业务文件;老师用它生成教学资料、测验和课程内容,学生们用它写起了论文……一天24小时在线,几乎零成本的专业人士在你身边做助手,不用它,用谁?比起抓耳挠腮没灵感的人类,AI机器人更像一台灵感喷涌的永动机。
如果说以前的客服机器人只能僵硬地被某些特定的关键词触发,难以理解用户个性化的问题,那么现在的则更符合人们期待的AI的样子——它正在朝着人的方向发展,而且是个拥有超强学习能力的人。
不过,值得注意的是,看上去功能强大,但它的数据仍然停留在前两年,无法做到及时更新。在日新月异、瞬息万变的现代社会,数据集无疑有些落伍。相信一旦它启动了和WEB的联动,就会实时根据互联网的信息进行更精准的回答。
其次,受制于数据集的质量,自己也无法克服用语啰嗦繁复、内容虚假或带有偏见等问题。比如谷歌刚刚推出聊天机器人巴德(Bard),就遭遇了十分尴尬的错误。巴德对着一张演示功能的动图表示,这是美国宇航局的詹姆斯·韦伯(James Webb)太空望远镜拍摄的太阳系外行星的第一张照片。实际上,这张照片是由欧洲南方天文台的甚大望远镜(VLT)拍摄的。谷歌表示,这凸显了对聊天机器人进行“严格测试”的必要性,而谷歌则因为这道史上最贵错题,一下子市值蒸发7000多亿元人民币。
还有非常关键的一点,因为是对话机器人,所以提问的技巧也非常重要。提问详细到位或者说提问的方式让机器人更容易明白,才会不断得到想要的内容。在很多领域,大家暂时还要忍受一段时间AI的“一本正经胡说八道”。
但这些,都不足以阻挡迅速进入各行各业,并引发各种涉及社会经济发展、商业模式、道德伦理的大讨论。
巨头打响“AI 大战”
随着 的火热,谷歌、微软、百度等国内外互联网巨头在近期掀起了又一次的“AI 大战”。
“谷歌可能只需要一两年时间,就会被彻底颠覆。”Gmail创建者之一、谷歌三号员工保罗·布赫海特近日公开表示,将彻底摧毁谷歌赖以生存的搜索引擎。不知道是不是出于对 可能颠覆搜索引擎的担忧,谷歌母公司在2月6日宣布将推出名为“巴德(Bard)”的聊天机器人服务以及更多的人工智能项目,以应对竞争对手微软所引领的新计算浪潮。
上图:谷歌CEO桑达尔·皮查伊希望谷歌的人工智能服务“大胆而负责”。
谷歌CEO桑达尔·皮查伊2月6日在其博客中发文介绍,“巴德寻求将世界知识的广度与谷歌大型语言模型的力量、智慧和创造力相结合。它利用来自网络的信息提供最新的、高质量的回复。用户可以直接用自然语言提问,而不是用关键词搜索。”他还强调,他希望谷歌的人工智能服务“大胆而负责”。
2月8日,微软宣布微软推出由支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器,新的Edge浏览器增加可以聊天与写作的必应。打开新界面,用户会发现,新必应的一种搜索模式,是将传统搜索结果与AI注释并排显示,而另一种模式是让用户直接与AI聊天机器人对话,用户可以在和一样的聊天界面中向其提问。
新版必应基于新款语言模型运行,比更先进,可轻松切换到人工智能聊天模式,并且能帮助微软利用网络知识与技术进行智能对接。微软CEO萨蒂亚·纳德拉将这次植入定义为“搜索引擎迎来了新的时代”。据第三方机构data.ai数据显示,必应应用程序的全球下载量一夜之间激增了10倍。
作为在国内 AI 行业下了重注的百度,也是反应迅速。
2 月 7 日,百度宣布即将推出类似 的对话式 AI 工具“文心一言”,英文名为 ERNIE Bot。
据称,目前百度正在对“文心一言”进行内部测试,将于 3 月完成全部测试。
实际上,早在2022 年 9 月,百度 CEO 李彦宏即做出判断,认为人工智能发展在“技术层面和商业应用层面,都有方向性改变”。有媒体据此推测,百度很可能从那时候就开始做文心一言。毕竟,涉及类似 的相关技术,在百度的人工智能框架中是现成的。百度在人工智能四层架构中均有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言则位于模型层。目前百度拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力。
百度在国内搜索领域的最大竞争对手之一360也于近期在互动平台上表示,计划尽快推出类技术的demo版产品。
除此之外,其他互联网巨头的动向也浮出水面。阿里巴巴内部人士证实,类产品也已经在研发中,目前处于内测阶段。而除了搜索类产品的方向之外,也有传言称,阿里巴巴可能将AI大模型技术与钉钉生产力工具深度结合。
在此之前,腾讯和字节跳动已经在搜索的赛道上拥有了叫板百度的资本——今年1月腾讯方面公布的数据显示,微信搜一搜月活跃用户已达8亿。腾讯方面目前已发布过一款智能创作助手文涌()。更有很多用户如今直接在抖音上满足搜索需求。抖音早已将本地生活、电商、问答等关键内容都整合在了一起。的出现,让这些公司在细分领域有了更多的想象空间,比如,个性化商务,推荐哪些连你都不知道的需求与愿望。
的商业化进程
狂飙突进的神话背后,是巨额的资金投入。截至目前,已经总计获得超过110亿美元的融资,微软、谷歌风投、马斯克等均曾出手投资,而且到目前为止并未盈利。但是的商业化脚步也在持续加速。
在其官网宣布将推出“ Plus”付费订阅版本,每月收取20美元,约合人民币134元。作为付费用户, Plus用户将获得在高峰时段更快的响应、优先使用新功能和改进。也强调,将继续为用户们提供的免费访问。上个月,发布了每月42美元(约285元人民币)的专业版 Pro。
这样的收入对于前期的巨大投入而言,似乎有些杯水车薪。但的爆火让人们看到以为代表的AIGC(AI ,AI生成内容)技术,有潜力产生数万亿美元的经济价值。相关数据显示,2020年培养一个大型语言模型需要450万美元,而到了2022年成本已经下降到45万美元。
不断下降的成本让的想象空间十分广阔。山姆·奥特曼最近在接受海外媒体采访时曾这样形容:他已不记得在网络搜索引擎出现之前是怎么搜索信息的,如果只关注昨天的新闻,就会完全错过现在的机会。目前,业内谈论较多的衍生方向就是AIGC产业。
根据投资界预测,未来两三年,与AIGC相关的初创公司和商业落地方案将持续增加,等到2030年,AIGC市场规模或将超过万亿元人民币。科技巨头们纷纷入局,AIGC初创平台不断涌现,国内外市场都表现出对AIGC的狂热。去年10月,英国开源人工智能公司.AI宣布获得1.01亿美元融资,投后成为估值超10亿美元的独角兽;几乎同一时间,另一家主打文字生成的AI公司也宣布获得1.25亿美元的新融资,估值达到15亿美元。
事实上,已经有企业尝试让上岗了。前不久,“美版头条”宣布使用来协助创作个性化内容。该公司CEO乔纳·佩雷蒂表示,人工智能主导的内容创作将从研发阶段转变为该公司核心业务的一部分。也就是说,要采用上岗写作,逐渐取代人类撰写。这则消息迅速引发投资者热情,让股价两天暴涨3倍。而在此之前,正陷入营收困境,将员工队伍缩减12%来应对资金压力。平台靠着咸鱼翻身,真实上演了一出“裁掉人工,雇佣AI”的黑色讽刺剧。
清华大学新闻学院教授、元宇宙文化实验室主任沈阳说,经过测试,他们发现程序员使用来写代码,最高可以节省四分之一的时间。这意味着原来需要四个程序员完成的工作,三个人即可完成,另一个程序员则可以被裁掉。
所以,现阶段离互联网较近的行业会快速应用,接下来,会越来越深入到法律系统、医疗系统甚至家庭陪伴。不少人认为,的意义主要体现在文字、图像的创作。实际上AI语音生成还能帮助渐冻症患者与老年痴呆症患者,以及文物修复等等。
安信证券指出,服务器+网络开启了人人“上网”的时代,而算力+算法将开启人人“上算”的时代——AI将以场景、应用、内容来创造用户的新需求。AIGC或在2023年迎来发展大年。
上图:《纽约客》杂志封面,提出了“未来会是AI工作,人类躺平?”这样的天问。
谁会被抢“饭碗”?
有人问,人工智能都学会内容创作了,画家、作家、翻译、记者这类以内容创作为主的职业,将来是否都会消失?
这看起来并非杞人忧天,去年美国科罗拉多州博览会举办一项绘画比赛,数字艺术类别的一等奖获奖作品《太空歌剧院》就是一名游戏设计师使用AI工具生成的画作。但人们也不必过于担心,AIGC技术目前尚不成熟,在音频、视频、图片、文字等形式的内容创作中存在明显的机械性问题,常常出错,还离不开人类的创意和把关。前述获奖画作就经过了设计师的反复调整、筛选,人类在其中付出了约80小时的脑力劳动。
完全可以预期,类似需求文档起草、简单文案生成和标题撰写、做个数据可视化报表、快速做点对比分析拿到比对结果、批量按照某种模板来快速剪辑生成短视频或140字微博等等类似的工作,的工作效率、准确度都一定远超人类。CBS之前需要剪辑5个小时的内容,现在5分钟就可以完成。随着的技术进一步迭代,它的能力还将进一步提升。
据说国内某个使用心得交流的群中,占比最大的群体是律师;其次的职业画像是各大公司的人工智能中心的人以及投资人;再次是创业者,偏saas、数据、科技、能源领域的比较多;最后是教育行业从业者,以及各大名牌院校的硕士博士生。
有博主抓取了微博和推特上最近一段时期关于 的讨论,发现微博和推特网友对讨论的话题有显著差异:微博网友主要表达了对职业取代的担忧和对 相关企业的股票市值的关注。推特网友主要表现出对学生使用 完成作业的争议、造成虚假流言的担忧以及尝试使用写诗作文的热情。
相同的是,他们都表现出了对 能力的极大惊叹,态度明显趋向于积极。由此可见,对于 人们也呈现出一种既爱又恨的复杂心态。一方面,它可以大幅提高工作效率,把人们从繁琐的重复劳动中解放出来;另一方面,“AI或将取代人类”的阴云恐怕将一直笼罩在人类头顶之上。事实上,新闻、高等教育、图形和软件设计等涉及内容输出的行业,都是可以逐步被取代的。
沈阳对此表示,消灭的是平庸的脑力劳动者,普通人的脑力思考将变得没有意义。“随着能力的提升,更高学历的脑力思考也显得岌岌可危,行业和社会要把教育的主要精力放到培养创新性人才方面。”
有观点指出,的本质是通过信息筛选帮助我们获得有用的解决方案,所以当你的认知和筛选能力变得远远不如甚至与最佳方案背道而驰时,你被淘汰就是大概率事件。你是否被取代,不取决于你在哪个行业,而取决于你的认知水平和对信息的甄别能力。
问题就变成了你是能够很好使用提升生产力的人,还是不能做到这一点的人。显然,两者之间能创造的价值差异将会非常巨大。在AI还是工具的阶段,AI本身不会让你失业,但“会使用AI的人”也许会让你失业。记者|陈冰
发表回复