世界级产品火出圈
2022年11月底,当我们的焦点还在担忧被新冠感染而不能正常工作时,位于美国加利福尼亚州旧金山的人工智能研究实验室,推出了一种人工智能技术驱动的自然语言处理工具,即人机对话机器人。它上线短短5天,注册人数就超过了100万。那个时候并不是最火的时候,至少90%的中国人还不知道这玩意儿。
事实证明,没有中国人参与的产品,不能称之为世界级的产品。在它上线个把月后,本就不算很高的热度随之褪去。
2022年12月中下旬,中国疫情全面放开,一波又一波感染过后,病毒一夜之间消失不见。真是应了那句俗话:大疫不过三!人们的生活逐步恢复正常。
时间转眼来到2023年,春节长假过后,股市的大门随之而开。毋庸置疑,资本的嗅觉就是比普罗大众更灵敏,更先知先觉,到头来你会发现,所有量级传播现象的背后,都是生意。1月中下旬,随着微软欲注资百亿美元等消息的扩散,国内投资者开始极度关注。在中国进一步“破圈”,国内搜索和讨论热度呈现爆发式增长,远超12月初期的热度小高潮,并还在持续增长中。
1月31日,同花顺新增“概念”,仅5个交易日,概念股涨幅已超25%。2月1日,东方财富网也推出“概念股板块”,2月7日,汉王科技7连板,海天瑞声也已经翻倍。此后更多个股加入炒作。由资本市场传导至新闻媒体、社交媒体、自媒,在中国开始发酵爆火。
瑞银报告数据显示,截至1月末,推出2个月时,其月活用户已经突破了1亿。根据数据统计,2023年1月期间,平均每天大约有1300万独立访客,这一数据是2022年12月的两倍之多。此后,每天的注册人数达4万之多。在中国大地上,彻底火了起来。
什么是?
到底什么是呢?它长啥样?它能做什么?它会给我们带来什么好处?它又有什么弊端?
2022 年 11 月 30 日, 的CEO, 在推特上写道:“今天我们推出了 ,尝试在这里与它交谈”,之后附上了一个链接,任何人都可以注册一个账户,开始免费与 的新聊天机器人 沟通交流。
,全称聊天生成预训练转换器( Pre- ),是开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型(Large model)并以强化学习训练。目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。如:在自动文本生成方面,可以根据输入的文本自动生成类似的文本(剧本、歌曲、企划等),在自动问答方面,可以根据输入的问题自动生成答案。还有编写和调试计算机程序的能力。在推广期间,所有人可以免费注册,并在登录后免费使用与AI机器人对话。
用通俗的话说,对于大多数人而言,它是一个智能机器人,你可以跟它聊天,但它又不仅仅是一个机器人,它还可以帮你处理一部分工作,甚至有媒体称,它将会取代一部分人的工作。面对如此强大功能的人工智能,很多人开始恐慌了。
不过,AI刚开始的时候并有这么智能,有许多问题难以解决,以致于它的发展也一波三折。
人工智能发展的三次浪潮
第一次浪潮(1956-1974年):
人工智能兴起。1956年,美国汉诺斯小镇宁静的达特茅斯学院,约翰·麦卡锡、马文·闵斯基、克劳德·香农等学者聚在一起,共同讨论着机器模拟智能的一系列问题。他们讨论了很久,始终没有达成共识,却为讨论内容起了一个名字:人工智能。自此,人工智能(AI, )开始出现在人们的视野,1956年也就成为了人工智能元年。
这一阶段,人工智能主要用于解决代数、几何问题,以及学习和使用英语程序,研发主要围绕机器的逻辑推理能力展开。但受限于当时计算机算力不足,同时缺少政府拨款,人工智能研发变现周期拉长、行业遇冷。
第二次浪潮(1980-1987年):
专家系统使得人工智能实用化。最早的专家系统是1968年由费根鲍姆研发的系统,可以帮助化学家判断某特定物质的分子结构。20世纪80年代起,特定领域的“专家系统”AI程序被更广泛地采纳,该系统能够根据领域内的专业知识,推理出专业问题的答案,AI也由此变得更加“实用”。
然而专家系统的实用性只局限于特定领域,同时升级难度高、维护成本居高不下,行业发展再次遇到瓶颈。第二次浪潮步入低谷。
第三次浪潮(1993年至今):
深度学习助力感知智能步入成熟。随着计算机算力的提升,AI技术迭代加速,AI与多个应用场景结合落地、产业焕发新生机。2006年深度学习算法的提出、2012年在训练集上图像识别精度取得重大突破,直接推升了新一轮人工智能发展的浪潮。2016年,打败围棋职业选手后,人工智能再次收获了空前的关注度。从技术发展角度来看,前两次浪潮中人工智能逻辑推理能力不断增强、运算智能逐渐成熟,智能能力由运算向感知方向拓展。目前语音识别、语音合成、机器翻译等感知技术的能力都已经逼近人类智能。
的发展
2015 年 7 月,著名创业孵化器 Y 的负责人,现创始人举办了一场私人晚宴,马斯克(Elon Musk)也在现场,还有26岁的布罗克曼,他是麻省理工学院(MIT)的辍学生和人工智能领域的专业人员,以及一些不懂人工智能但都看好这个领域的大拿。
那时,谷歌刚刚收购了一家总部位于伦敦的人工智能公司(就是推出了打败围棋冠军的的公司),在、Elon Musk和其他科技业内部人士看来,如果 成功了,谷歌可能会垄断这项无所不能的技术。这次晚宴的目的是讨论组建一个与谷歌竞争的实验室,阻击谷歌。
2015年12月,公司在美国旧金山成立。 捐助者不仅有特斯拉的创始人马斯克(Elon Musk),还有全球在线支付平台 的联合创始人彼得·蒂尔、的创始人里德·霍夫曼、创业孵化器Y 总裁阿尔特曼(Sam )、的CTO布罗克曼(Greg )、Y 联合创始人 ;还有一些机构,如YC ,创立的基金会、印度 IT 外包公司 和亚马逊网页服务。创始捐助者共同承诺向这个理想主义的新企业捐助 10 亿美元(尽管根据税务记录,该非营利组织只收到了引人注目的承诺的一小部分)。
在成立初期,的研究重点主要集中在机器学习和自然语言处理领域。在2016年,成为了世界顶级AI会议NIPS的金牌赞助商,并在该会议上展示了自己的技术和成果。
在2017年,发布了一款名为GPT-2的自然语言处理模型。该模型可以进行语言生成、问答和文本分类等任务。这款模型在自然语言处理领域取得了很高的成就,也引起了学术界和业界的广泛关注。此外,还在2017年发布了名为 Gym的平台,这是一个基于的强化学习平台,为人工智能研究人员提供了一个实验环境。
在2018年,开始在机器人领域进行研究,研究的机器人手臂可以进行高精度的物体抓取。的机器人手臂在物体抓取方面取得了很高的成就,得到了很多研究机构和公司的关注。
2018年Open AI基于公司模型推出了具有1.17亿个参数的GPT-1( Pre- , 创造型预训练变换器)模型。
2019年,发布了名为GPT-2的自然语言处理模型,这是一个规模更大、更先进的自然语言处理模型。该模型可以进行大规模的语言生成和自然语言处理任务,并取得了非常出色的成果。2019年7月,重组后的 新公司获得了微软的10亿美元投资。
2022年,团队基于GPT-3,使用奖励模型和更多的标注过的数据继续优化微调过的语言模型,并且进行迭代。最终得到的模型被称为。
2022年12月,Open AI 发布 ,是对GPT-3模型(又称为GPT-3.5)微调后开发出来的对话机器人。
2023年3月15日,发布了-4.0版本的更新,并且打上了“most ”的tag。
4.0版本可以用强大到恐怖来形容?为什么这么说呢?举个例子,在它的宣传视频上,GPT-4通过识别一个简单的草图,就识别出了这是一个关于网站的草图;然后“顺手”生成了建成这个网页的全部代码,再然后,一个网站就这样建成了。
.0版本发布后,经过很多权威机构的各种测评,发现它的知识储备和智力水平,达到甚至超过了很多行业专家。例如,.0 能够高分通过美国医生执业考试,能够高分通过美国执业律师资格考试,能够理解各种科研论文。
的应用
的应用领域非常广泛,尤其是在自然语言处理、图像、视频、语音、数字处理等多个方面显示出强大的功效,从日常生活到专业领域,都可以用它来帮助我们。
第一个领域,在写作领域的应用。
具备文本等内容创作能力,可用于文学创作、新闻撰写、报告生成等方面,可以极大提高创作者的效率。前面我们也说了以前写稿子得半天时间,现在几秒就能生成。
第二个领域,在智能客服领域的应用。
可以帮助智能客服实现更加智能化的服务。可以根据用户的提问,自动生成合适的回答,从而大大提高了智能客服的效率和准确性。此外,还可以通过不断的学习和优化,逐步提高其应对各种问题的能力。
第三个领域,在教育领域的应用。
可以被用于智能教育助手的开发中。在学生学习过程中,可以帮助学生解决问题、回答疑问,提供更加个性化的学习体验。此外,还可以帮助教师自动生成教学材料和试卷等,也能自动评阅试卷和练习题。
第四个领域,在翻译领域的应用。
以前翻译,你要用翻译软件,有了,你可以让它翻译成几十种甚至上百种外语,而且还非常准确。你想想,如果你会用,有人还不知道,你就可以用它给别人翻译,收取一定的费用,不也是很好的赚钱渠道吗?
第五个领域,在医疗领域的应用。
可以被用于智能诊断和辅助治疗中。通过对大量的医疗数据进行训练,可以帮助医生更加准确地诊断疾病和制定治疗方案。此外,还可以用于病人的健康管理和医疗咨询等方面。
第六个领域,在金融领域的应用
金融领域也是可以应用的领域之一。可以被用于智能投资和风险管理中。通过对大量的金融数据进行训练,可以帮助投资者更加准确地预测市场趋势和制定投资策略。此外,还可以用于金融咨询和客户服务等方面。
第七个领域,在编程领域的应用。
拥有编程相关知识,并有能力根据用户需求编写代码或查找bug,可作为辅助工具大幅提升用户编程效率和质量。
上述领域仅仅列举了一部分,在各行各业都可以充分利用。随着在更多领域的广泛应用,许多职业如客服、记者、程序员等将受到一定程度的冲击,但其高效所带来的作用,将会更好服务于人类的工作和生活。
的缺点
虽然 的能力让人极其兴奋,但仍然存在一些局限性,具体如下:
1) 在训练的强化学习 (RL) 阶段,没有真相和问题标准答案的具体来源,来答复你的问题。
2) 训练模型更加谨慎,可能会拒绝回答(以避免提示的误报)。
3) 监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应。
4)要学会如何与 沟通也需要技巧,有时模型最终对一个短语没有反应,但对问题/短语稍作调整,它最终会正确回答。不好的是,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。
5)由于训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致输出倾向于更为冗长的回答,以及模型中会过度使用某些短语。
6) 造假。由于的设计初衷是用以对话式问答以及模拟人类的对话行为,在面对某些关键词检索场景时,虽然能够给出一定的解释,但却无法为用户提供足够有帮助的增量信息。而在面对某些模糊问题或是论述性问题时,为了能够使其回答更具有信服力,似乎选择了对其生成的部分内容进行造假。比如,当一位记者要求撰写一篇微软季度收益的文章时,为了增加文章的可信度,将微软首席执行官Satya 的一次报价进行了伪造。
7)容易受到外界信息的影响。由于 是具有学习能力的,模型能够记住此前与其他用户的对话内容,并将其进行复述。这就导致了用户将能够非常轻易地干预对于问题的判断与回答。
总之,虽然 有了更好的强化学习的训练数据,但它目前并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏,地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。
的未来前景
的发展已经开始影响到人们生活的方方面面,它不仅能更好理解人类语言,还能在各行各业为人类提供解决方案和辅助功能,给人们带来了非常好的体验,开始改变人类的生活及工作方式。
在20世纪90年代的课堂上,老师们告诉学生,未来有三项技能是必备的,其一是会开车,其二是会使用计算机,其三是会说英语。现在回过头来看,这三项技能已基本为大众所掌握。
那么今天我要告诉大家,当今及未来,学会使用也将会是人人必备的一项技能,如果你不具备,最终很有可能被替代。的效率很高,但它始终是为人服务的,如果你能抢先一步学会使用这项工具,以此提高自己的工作效率,不但能让自己的岗位变得不可替代,升职加薪的几率也会大幅提高,更重要的是,我们用这项工具为孩子的能力提升服务,将会让我们的孩子赢在起跑线!
发表回复