近期,在流畅对答、写代码、写剧本、辩证分析、叫错等测试中的惊人表现,让人工智能第三次震惊全球。
券商报告强推,国内大厂紧紧跟随,人们热衷于讨论它的神奇,比尔盖茨更是意味深长地提示:出现的重大历史意义,不亚于PC和互联网诞生。
是昙花一现,抑或引发一场新的技术革命,推动第四次工业革命。对经济社会发展和企业发展有什么影响,值得探讨。
01
的前世今生
源于以深度学习为代表的人工智能技术的长期积累。自上世纪40-50年代诞生以来,人工智能发展重心不断由基于规则的智能,逐步向基于数据的机器学习阶段演进,三次震惊全球。
第一次在1997年5月11日,IBM研制的并行计算机“深蓝”击败了雄踞世界棋王宝座12年多年的俄罗斯国际象棋大师卡斯帕罗夫。
第二次在2016年3月15日,人工智能战胜围棋世界冠军李世石。
第三次在2022年11月30日,美国人工智能公司开发的大语言模型惊艳登场,推出后5天用户数突破100万,2个月用户数突破1亿,是互联网领域发展20年来增长最快的消费类应用程序。
Chat意思是“聊天”,GPT 拆解为“、Pre-和”。
——突出生成性,生成程序代码。意味着是生成性的人工智能;此前局限于观察、分析和分类等内容。
——Pre-是预训练,表明这个模型已经接受过大量数据的训练。这些数据是人类编写并发布在互联网的数据。通过监督学习和人类反馈强化学习两项技术进行预训练。
——是一种深度神经网络,人工智能机器学习算法架构,“自注意力”机制,允许模式在进行预测的时候,可以根据语言序列的任何位置为输入数据的不同部分,赋予不同的权重,并支持处理更大的数据。
字面拆解,就是生成性预训练变换模型。2月13日新华社刊发文章称,“,是新一代聊天机器人的突破。”
从技术上看,是运用AI驱动的高级自然语言处理工具,属于人工智能生成内容(AIGC)技术。但属于高情商对话AI,强调用对话的方式来提供给你答案,而不像传统扫搜引擎那样扔给你一堆信息源让你自己来筛选。
更像是个“续写”机器人。通过大量的学习,学会了词汇之间的组合规律,然后根据这个规律来进行“续写”。核心技术优势是,能够根据用户的实际环境、聊天技巧和需求来完成精准的推荐,提升了理解人类思维的准确性,并能快速做出执行。生成贴近人们思想的新内容,帮助人类进行真实创造,提出新颖想法等。
02
下半场,如何走
与任何快速发展的新技术一样,有惊艳的表现,但也存在不容忽视的局限和风险。
一是无法提供最新的资讯。是大型语言模型,要更新信息内容需要重新读取庞大的文献数据,很难做到频繁更新。
二是逻辑推理能力有限。本身并不具备对复杂和抽象系统的理解能力,它的“认知”是建立在虚拟训练文本之上,完全依赖数据库的内容,并不能很好的解决逻辑推理问题,逻辑推理能力不足。
三是不可解释。所有基于深度学习算法的通病。并且,它的回答质量依赖于用户问题的清晰程度;只要经过稍微“调教”,的回答风格会大相径庭。
四是有些回答与事实不符。由于所掌握的知识范围是被限定了的,它不能预测未发生过的事,无法分清真实和虚构,也不能深入问题的细节,在部分领域还缺少知识的准度,容易导致产生有偏见或误导性信息。
短期来看,要想实现快速推广,仍面临着技术、合规、道德等方面的多重障碍。
一是的解答受制于数据的影响。一方面,受数据集偏见影响,容易会根据数据集中的文本做出有偏差的回答;另一方面,模型内保存的有些信息比较旧。譬如,问它“微信的成长历史”,它的答案只到2021年。
二是缺乏语言能力。模型主要通过语法而不是语义来理解文本,无法捕捉到文本真正的意思;有时会忽略文本中的暗示和隐喻,不能识别反问,不能处理复杂的句子等等。
三是存在知识产权争议。数据训练中使用的大量来源广泛的知识资源所涉及的知识产权如何确定,对数据挖掘是否需要获得相应的知识产权授权?
四是法律责任问题。的行为表现及后果与相关自然人法人间的法律责任如何界定?
五是虚假信息传播风险。模型产生的回答偏差进而会带来虚假信息传播的法律风险,如何来规避。
六是用户隐私保护。模型的运营方未必能检测到所有的问题,一些敏感的问题将可能造成数据和隐私泄露。
一是多模态化发展。是生成式人工智能技术浪潮的一部分,不仅包含语言智能,还会包含语音智能和视觉智能等,未来技术是多模态的。目前专注生成文本、诗歌、文章等; 模型的发展将继续推进生成式AI应用发展,后续有望在图像、音频、游戏、3D等领域深度推广应用。
二是有望成为操作系统的新雏形。具有类似于操作系统的创新性特征,在充当新的人机接口上具有更智能地实现用户指令的解译、减少用户的操作等优势。如果把作为为一种操作系统,用户只需要输入自然语言便可以达到操作的目标,有望发展成为新一代操作系统的平台。
三是商业化应用向资源、资金高度集中和技术应用强的领域聚焦。的进一步发展,可能会与微软、谷歌等大厂合作。当然,现有的大型商业平台也可能自行进行技术研发,各大厂商之间的竞争在于模型层面竞争。无论哪一种方式实现商业化发展,必然会聚焦于资源、资金高度集中和技术应用性强的特定领域。金融、文化娱乐、办公软件等领域率先商业化应用的可能性较大。
03
的影响
为我们提供了一个新模板,推动人类信息消费习惯的进步,以此基础赋能产业。
作为一种新兴的超智能对话AI产品,不仅是新一代聊天机器人的突破,或将对人工智能乃至整个信息产业带来巨大变革,推动人工智进入大模型+大数据+大算力的超大模型的时代,开启通用人工智能应用领域的新篇章。
迄今为止,人类经历了三次工业革命浪潮。这三次工业革命都与科学技术领域的革命性进步息息相关。更多的用户交互,在带来更大市场和更多收入的同时,也将提供更多的学习反馈,从而促进人工智能优化完善,推动人工智以更加方便和舒适的方式向社会普及。从引起生产方式重大变革的角度来看,未必能引发第四次工业革命,主要在于目前尚不能形成新的主导产业和支柱产业。
在“基础大模型+指令微调”方向探索出新范式,基础大模型和人类大脑类似,指令微调是交互训练,两者结合接近人类的语言智能。并且,采用“基于人类反馈的强化学习”训练方式,以人类偏好作为奖励信号,使模型越来越符合人类认知理解模式,由此产生大量生成性内容,带来巨大效益和多方面影响。能够帮助人类进行真实创造,提高获取信息的效率或提出新颖想法,供人类去探讨解决。
2008年次贷危机后,全球经济复苏主要靠货币宽松和债务驱动,目前并没有证据表明全球生产率出现了明显改善。所带来的生成性内容,创造出许多创新性的场景和解决方案,有望提升生产力曲线,促进社会生产效率提升。但本质是贝叶斯定理的“逆概率”,不能取代人类。
AI的发展首先要靠算力数据的指数级发展。以大模型、大数据、高算力为基础,将进一步催生算力需求的巨大市场。算力技术加快向社会的方方面面渗透融合,各行业的融合应用竞相迸发,赋能智慧城市、智慧医疗、智慧农业等行业高质量发展。据国际数据公司IDC与浪潮信息的联合研究判断,未来5年我国智能算力规模的年复合增长率将达52.3%。
算力基础设施建设成为产业升级的一个新方向。算力是数字经济发展的重要一环,算力基础设施是释放数据优势、推动数字经济创新发展的“底座”,成为各地加快数字经济发展、发挥投资拉动的重点领域,带动万亿级别相关产业市场规模。
优化我国数字经济产业布局。推动数字经济进一步均衡发展,在“东数西算”国家工程下,相关设施建设正从我国东部沿海地区向中西部地区扩展。
一方面,提高劳动效率,推动更高质量就业。利用来创造新产品,提高获取信息的效率或提出新颖想法,让人可以有时间和精力去做自己更擅长、更适合人类做的创新性的工作,优化就业结构。同时,代替人工去做一些重复性工作,或能减少人们劳动工作时间,缓解生产力发展与既有生产关系之间的矛盾。
另一方面,可能引发技术性失业。可以比人类更高效地完成数据整理、文稿编辑、机械重复类工作,原来由人完成的工作被机器代替完成。像记者、市场研究、金融分析、交易员、平面设计、客服、程序员等相关工作容易被替代。由于旧岗位的替代与新岗位的创造,本身不太可能导致大规模失业。
的重大突破带动产业转型升级,促进产业结构优化,推动生产方式发生巨大变革。
赋予教育材料新活力。利用技术使课本呈现形式多样化、立体化和具体化,使知识传播更加生动,激发学生兴趣。
促进金融降本增效。实现金融资讯、金融产品介绍视频内容的自动生产;精准挖掘客户市场需求,提高利率市场化水平;塑造虚拟数字客服,提升金融机构运营效率。
赋能医疗全过程。方便挂号候诊,增加病人满意度;改善医学图像检查检验质效;辅助病情诊断和医嘱处方,减轻医生工作压力;辅助病人康复治疗,如使用语音合成技术为失语者合成语言音频等。
推动制造业体质增效。生成技术可实现工业设计中重复、耗时、低层次任务的自动化,提升制造设计能力,加快智能化发展。
2月17日,刘鹤在何梁何利基金2021和2022年度颁奖大会上指出,“人工智能出现颠覆性的变化”。应该说,从技术到生产力的转化,或能对企业转型升级形成倒逼机制,推动企业数字化、智能化发展。
对多数企业的发展利大于弊。可利用在纠错、辩证分析的优势,提高企业管理运营能力,排查企业在审计预算、经营风险、战略执行等方面问题;还可利用打造虚拟客服,塑造营销优势等。
图片来源:/
发表回复