近来,聊天机器人程序爆火“出圈”,引发各界关注和讨论。
的未来技术发展趋势
基于的工具被称为大型语言模型(Large ,LLMs),通过学习庞大的在线文本数据库中的语言统计模式来工作。基于现有的基本原理和技术,在未来发展进程中必然会进一步提升自身的技术水平,例如提升检索结果的质量。
技术提升的方式,一是需要将海量数据,尤其是实时的新数据增加到原有的文本数据库中,对其中不实、偏见或过时的信息进行更正,并以更新的文本数据库为基础,进行进一步的模型训练,以实现技术模型和应用工具的与时俱进。
二则是需要针对某些特定领域,进行专业化的模型训练,以实现技术提升。与之相比,更早诞生的智能问答和检索由于基于的模型较为简单、智能化程度不高,比较容易被识别;而基于LLM的在技术上的进步,使得它能够进行逻辑筛选,针对输入的问题提供一个大体合理的答复。但是,从本质来看它的回答仍然是不可靠的,在回答一些专业领域问题时也会产生错误的回答。因此,在一些特定的、专业化程度较高的领域,需要提供专业化的文本数据库、基于针对性的训练方法对模型和数据进行调整。以文史哲和理工科领域的问题研究为例,其需要的方法论和逻辑思维方式是不同的;在同一个学科的不同场景下,需要的分析思路也是不同的。因此,未来发展需要针对特定领域进行专业化的模型训练。
的商业化发展趋势和应用领域
的进一步发展同样离不开技术的应用和商业化。其商业化方式,一是与现有的大型商业平台(如微软、谷歌等)进行合作。虽然有相关人士称要实现由LLM驱动的搜索仍需要大幅降低其成本,但与此同时,微软计划将整合进他们的搜索引擎Bing并预计在3月份推出。此外,现有的大型商业平台也可能自行进行技术研发。这两者是否实现产品替代取决于两种方式的开发速度。
无论以哪一种方式实现商业化发展,必然首先聚焦于资源、资金高度集中和技术应用性强的特定领域。例如,金融领域技术应用较为广泛、资金充沛,金融科技、金融数据治理等都在金融领域率先开展;文化娱乐领域商业化变现较为迅速,同样可能会成为技术应用首要涉及的领域;与日常工作相关的办公软件等领域,如果能基于该项技术实现部分自动化办公(如自动化公文写作、PPT制作),由于其应用广泛、用户需求量大,也可能成为技术应用首先发展的领域。
的阶段性发展趋势和商业化竞争趋势
作为一种新的技术和工具,很可能与其他新技术和工具类似,在首次进入大众视野时会得到较多的研究和关注,在国内外诞生大量相应的创业公司或上市公司进行赛道布局。但在经过一段时间的激烈竞争后,实际成功并存活的公司并不多。这也是高德纳咨询公司()提出的技术成熟度曲线所反映的状况。目前很可能正处于该曲线中过高期望的峰值阶段,即将到达泡沫化的底谷期。在它实现应用和实施以后,在某些具体领域和场景中的应用效果可能并不及预期。
在这一过程中,会有很多创业公司或上市公司逐渐退出市场。从国内来看,推测最后存活和成功实现技术应用的相关平台,很可能是具有充足资金、流量基础和现有数据库的大平台,例如百度、头条等。其余一些创新型公司或小型专业化公司,可能会遇到训练集不足、无法实现模型的有效训练等问题,最终退出市场。在这期间,相关上市公司的投资和股票价格可能快速上涨,但最终能够实现该项技术的国产化替代的,依然是现有的大平台。
发表回复