2023年以来,以GPT为代表的多模态大模型得到市场广泛关注,在其快速的演变进程中为机器人行业带来的潜在应用价值,让我们不得不再次将目光聚焦于此。
在原先,基于的GPT-3.5模型的已经让我们足够震惊,其标志着AI从量变到质变的过程,在服务机器人上表现了极强的可拓展性。而3月份问世的第四代GPT模型更是支持图像、文本输入以及文本输出,同时还最多能够实现2.5万字理解,表现出了在多模态、理解能力、角色认知、长文本支持等方面的明显进展。
如果按照这种进展速度预估,那么GPT类技术将有望快速使服务机器人拥有更高的自主性和适应性,以及更优秀的协作能力,对话式语言模型技术扩展更多服务机器人的交互应用场景,将提质增效带动行业再升级。
▍服务机器人打开全新可能
对于GPT到GPT-4的改变,服务机器人企业或许有着更为直观的认知。
因为从技术底层逻辑而言,服务机器人受到这类新技术的影响会更为明显。猎户星空董事长傅盛就有一句很有趣的形容,“如果以前他是一个瞎子,现在他已经能看见。这意味着世界要变了。”
曾经,大部分服务机器人主要是根据固定的文本进行泛话交互,更有一部分服务机器人只是能够提供语音播报,更多服务机器人仍体现在具体功能层面,服务机器人智能化程度不高一直是行业瓶颈。
然而GPT等人工智能技术的不断进化,将为服务机器人的交互带来质变,这也使得服务机器人行业已经迎来拐点,服务机器人能够更好服务于人的趋势愈发明朗。
虽然GPT-4目前还只能够针对静态图片进行结构识别,但从GPT3.5到GPT4.0可以说已经形成了一个技术浪潮。从文本到图片再到动态视频,这意味着训练数量更大,同时支持多元I/O形式,而这也直接使得GPT技术的专业领域学习能力更强。
GPT-4和GPT-3.5在一些普通的谈话测试中的性能区别不大,但是由于GPT-4具有一定的多模态能力,能够进行图文结合输入的分析,在处理较为复杂和专业的任务上,毫无疑问GPT-4相比GPT-3.5则表现更优。这使得我们可以预见,随着GPT技术的不断迭代,整个世界的生产力变革即将随之而来。
对于服务机器人而言,这就意味着有望带来多场景智能化升级。因为抛开固定硬件,服务机器人的内核其实是AI,那么GPT大模型毫无疑问有望成为机器人“智能大脑”,而拥有一个更强智能的“智能大脑”后,机器人必然会完全不同。
例如在原先,猎户星空等企业的服务机器人主要被应用于企业前台、学校、政务大厅、展馆等场景,猎户星空的豹小秘系列语音接待服务机器人就承接了接待来宾、联动门禁、导航引领、无人讲解、政策宣传等工作,主要帮助企事业单位数据化管理,提升了办事效率。
而加入GPT大模型后,首先会使得服务机器人的交互能力有望得到大幅改善,这就可以被应用于机器人与人类之间更广泛的自然语言交互,提升机器人的智能化水平。同时,GPT-4更具创造性和协作能力,可以与用户一起生成、编辑和迭代创意和技术写作任务,让服务机器人不再是“工具人”。
例如有研究就针对GPT-4多语言功能解决各类语言模型问题。有测试表明,GPT-4在英语和绝大多数小语种上的精确度均高于GPT-3.5的理解,GPT-4在各类任务上幻觉问题显著减轻,比最GPT-3.5模型约减轻 30%—40%。这使得加入类GPT语言模型的机器人,能够更加容易服务全球更多人群,带来语言交互上的全新体验。
又例如通过学习和分析用户的历史行为和喜好,GPT可以为用户提供更加个性化和智能化的服务,从而提高用户的使用体验和满意度。而未来随着人机交互技术逐步成熟,机器人更是可具备听、说、理解与思考能力,并提供重要陪伴与娱乐功能,如果GPT-4具有更广泛的通识知识和问题解决能力,必然可以更有效地解决用户难题,加速机器人规模化商用。
其次,GPT可以帮助机器人在执行路径规划、物体识别等任务时快速作出相应的决策,让服务机器人更为灵活。因为GPT-4的高级推理能力更强,处理复杂任务时更可靠、更有创造力,并能够处理比较微妙的指令,这将进一步提升人机交互能力与自主运动能力。
机器人通过GPT来理解人类的自然语言指令,并根据指令完成相应的连贯性复杂动作。通过自然语言指令-多模态大模型-终端执行机构的工作原理,利用多模态大模型对特定任务中的物体识别,加入GPT的服务机器人能够理解用户的语言指令,结合多模态数据感知,匹配语言指令做出规划和执行,完成更多生活环境中常见的复杂任务。
未来如果进一步将人机交互能力与自主运动能力融合,无疑有望大幅提升服务机器人产品的体验感,加速机器人多场景规模化落地,真正打开服务机器人的应用端场景。
▍布局更远未来
当前,全球对于GPT技术的实际落地价值都仍然处于探索阶段,但其应用潜力正得到快速挖掘,机器人是目前许多开发方向中尤其重要的一条线,尤其是服务机器人凭借着越来越高的市场占比份额占比正得到越来越多的关注。
我国服务机器人企业就早有类似入局者。
例如成立于2016年的猎户星空,作为人工智能服务机器人的代表企业,凭借前瞻性判断,猎户星空目前已经具备6年以上人机交互语言储备,在政务、医疗、康养、工厂、餐饮等领域打造了20+解决方案,接入类GPT技术后的猎户星空服务机器人家族,落地产业场景无疑会更加多元,并更加智能,人工智能2.0时代将带来数字生产力变革,猎户星空也做足了迎接新一代技术变革的准备。
猎户星空董事长傅盛近期演讲就提出过一个看法,是第一款理解了人类语言逻辑的AI,其通过文字理解了这个世界并拥有了推理和创造能力。而在此之前, 这恰巧是人类作为碳基生命引以为傲的根基。
为此,拥抱和大力迎接类GPT技术带来的汹涌交互革命和生产力革命,已经成为服务机器人头部企业的本能反应。
一方面由于服务机器人的市场空间非常广阔,实现类GPT技术与服务机器人的融合,有望提升机器人的智能化水平,带来更多的市场份额。根据IFR预测,2024年全球服务机器人市场有望达290亿美元,而根据弗若斯特沙利文预计,2026年全球/中国服务机器人市场空间将达到676亿美元/1558亿元。
另一方面,则是目前服务机器人作为数字经济的重要载体,其作用得到了越来越多的关注。正如猎户星空所提到的一个概念,服务机器人作为人类跨越智能手机时代步入机器人时代的标杆产品,意味着实体场景即将走向数据化,这也将重新定义流量入口。
这也意味着服务机器人不仅具备了成为数据载体的基本条件,更是未来GPT技术升级的基础。因为获取数据是GPT技术算法训练的第一步,而高质量数据是算法成功的关键。
如今,伴随着“机器人+”赋能产业,科技发展已成为驱动商业变革的关键,凭借着巨大的市场空间,服务机器人已形成规模商用化趋势。类GPT技术的加持后,语音交互服务机器人进入C端家庭场景的步伐提速,市场容量将进一步扩大。
当然,市场是最好的试金石,在实体场景拥有一定量级、核心自研技术、产品能力以及品牌护城河等优势的服务机器人企业更容易跑出。
▍结语与展望
GPT的进化路上已经出现了超乎人类想象的现象。
GPT必然将引领一场新的工业革命,它将带来生产力的大幅提升,进而提升国家竞争力。
长期来看,伴随AI算力升级及传感技术发展,强算法的机器人类及智能家居平台类产品的迭代速度加快,智能化程度有望发生质变,如识别能力和交互能力大幅提升将帮助服务机器人进一步实现升级。
随着“类GPT”的潜力初露端倪,猎户星空等在智能领域深耕多年的企业,毫无疑问已经更加明确和坚定了服务机器人的未来发展方向。相信未来,包括猎户星空在内的中国服务机器人企业,将在人工智能的不断加持下迎来新的发展机遇,打开迈向AI新纪元的大门。
排版 | 麦子
发表回复