导读

时至今日,网上关于和GPT-4应用案例的总结已经非常多了,本文中我们将简洁直白地探讨它们的核心技术特征,并根据实际例子讨论它们在我们老本行——民航领域的潜在应用。不想看技术原理的小伙伴也可以直接跳到应用部分。

由于并没有完全公开和GPT-4的具体实现技术和细节(只能感叹如今的不再open),所以有些内容是主观猜想,肯定会有不对的地方,欢迎一起探讨!

01 到底什么是Chat GPT ?

2022年11月发布后,仅仅两个月时间用户数量就超过一亿。继高开“疯”走后,在一周前又推出了升级版模型:GPT-4。越来越多的人都开始探索GPT-4的能力上限,大多数用过的用户都给出了好评。

微软旗下的新版必应也使用了GPT-4,在搜索引擎的加持下,这个模型似乎能用于更多真实任务场景,比如:

其实就是一个对话机器人,用过Siri、小度、小冰的人想必都知道,这并不是个新鲜玩意儿,为什么就能在一众对话机器人中爆火出圈呢?简单说就是依靠它的三板斧:

1.强大的自然语言理解能力;

2.能生成流畅自然的回答;

3.可以根据上下文进行多轮问答。

换句话说,不仅”听得懂“,还会”说人话“,上至学术大家、下到黄口小儿,都能和它侃上几段。

02三分钟读懂技术

其实,并非这个人工智能模型的初代目,它是在GPT3.5的基础上训练而来的,而GPT3.5是GPT系列模型的3.5代。追根溯源,最早的GPT-1是在2018年6月提出的,来看看GPT家族的族谱:

GPT是什么意思呢?其实我们看名字就能简单理解。

特征一:生成式

是一种”生成式”人工智能。什么叫生成式呢?说人话就是“无中生有”。这意味着它可以接受一组输入,并根据这些输入生成充满惊喜的(也可能是惊吓)的内容。

说句题外话,其实还开发了一款能生成图片的人工智能模型:DALL·E 2,它可以根据用户输入的文字描述生成图片,下面这个图片就是它根据用户要求生成的(捏造的):

此外,还有谷歌推出的音乐生成模型:。输入一段话,给你一首歌。如果你输入下面这段话,模型会给你生成这样一段曲子。来听两段练习时长一年半的AI写的曲子:

特征二:预训练

采用了一种经典的人工智能模型训练策略:”预训练+微调”。预训练就是使用海量数据预先训练一个生成式语言模型,微调就是将预训练过的模型作用到你自己的数据集,使模型性能更好地匹配你自己的任务。

这个过程怎么理解呢?打个比方,这就好比一位拥有1000小时飞行经验的B737机长,如果要转A320,那么这个机长只需要进行“机型改装“,而不必像“大改驾”学员一样从头学起。

因此,预训练的好处就是速度快。预训练模型是从大量数据中训练得来,比起在你自己的数据集上从头开始训练的方式肯定要快一些。

特征三:

是模型的基本结构,也可以说是它能够理解和处理人类语言的关键。抛开诸多技术细节,用人话来说,本质上一种概率统计模型,依靠概率分布来预测输出序列中的下一个单词是什么。

很多常见的知识或事实,比如“C919是国产大飞机”,因为在训练数据中出现频率高,上下文之间的模式比较固定,预测的词语概率分布就比较尖锐,容易记住,从而可以输出正确的事实或知识。

巧妇难为无米之炊,如果单有模型,没有足够的训练数据也不能实现,这就引出了它的下一个特征:大模型。

特征四:大模型

是一个大规模语言模型(Large Model),什么叫大模型?简单说他的特点就是超级大。

失业的数据_公开失业_chatgpt 让大数据开发人员失业吗

咳咳,简单说,大模型的特点就是“三超”:超大的训练语料、超多的模型参数和超强的算力资源。

先说说超大的训练语料和超多的模型参数。

使用了来自互联网的大量文本数据进行训练,最终得到一个包含大量参数的语言模型,因此才能够生成令人满意的文本内容。到底有多大呢,我们拿GPT家族的几个模型对比下:

可以看到每一代GPT所用的数据量都在变大,这么多数据从哪儿来?说数据来源是维基百科、书籍、期刊以及其他网络数据集。从这个角度来看,我们普通网民是不是也算是技术入股了呢?

再说说超强的算力资源。

刚刚说到GTP-3参数量1750亿,预训练数据量45TB。据估计,支撑模型训练的基础设施至少需要上万颗英伟达芯片,一次模型训练费用460万美元,总训练成本达1200万美元。此外,也有人估算,现在运行的算力费用为每天10万美元。

正是靠着这“三超”,展现出了大模型的特有优势。其背后的训练语料量级和覆盖领域完全超过了个人能够掌握的极限,它可以轻而易举地输出横跨多个领域和学科的观点并融会贯通。

总之,以及最新的GPT-4并没有那么神秘,它本质上就是将海量的数据结合表达能力很强的模型结合,从而对自然语言进行了一个非常深度的建模。对于一个输入的句子,能在这个模型参数的作用下生成一个回复。

理解这些技术特征,对我们讨论在民航圈儿的应用十分有帮助,接下来我们就来看几个例子。

03 “+ 民航”能干什么

3月11日,在集成了的新版必应推出一个月后,微软正式宣布必应日活用户首次突破1亿人,大有挑战老大哥谷歌之势。

“ + 搜索引擎”只是开始,未来,笔者认为很多软件的底层都会嵌套类似的模型,比如文案创作工具、作图工具、聊天工具、购物工具等等。那么,在民航领域会有哪些潜在应用场景呢?

应用一:智能客服

首先我们最容易想到的是面对旅客的智能客服,不同于目前航司使用的智能客服,似乎可以提供更加精准的旅行建议,以及行程规划、自动值机等等的服务。

比如,问它哪些东西可以带上飞机?可以看到,面对这个故意挖了个坑的问题,给出了大家想要的回答。

应用二:技能提升和训练

我们回到圈子内来看,的一个应用是与专业人员(飞行员、管制员、机务等等)面试和培训相关的工作。比如为待测试人员进行一场模拟面试:

又比如,为飞行员进行一场PEPEC模拟考试,可以看到作为一名模拟考官,与学员的互动交流很自然,而且还帮考生找出了需要完善的地方:

再比如,让解释一下ICAO文件中“shall”和“”的区别,这个回答还是很符合真实情况的:

你还可以让它给你的孩子讲解民航知识,下一代的民航业务提升也不能落下:

应用三:文案写作

文案写作是我们每个人都绕不开的工作,在不久的将来,借助这类工具,文案写作可能会变得越来越高效(打工人的头发保住了!)。

前几天,微软已经公布了由AI驱动的 365 ,从介绍视频中可以看出,它打破了传统办公软件的方式,能自动生成文档、电子邮件、PPT。

想象这样一个场景,你要写一个B737的SOP的文档,于是你先让帮你列一个大纲,之后只需稍加完善便能交差,写作效率蹭蹭上涨!

篇幅所限这个回答没有提供完整图片

应用四:辅助运行

民航领域有眼花缭乱的各式报文,比如AFTN报、SITA报、ACARS报等等,以至于你我虽然同属于一个民航圈子,但是对于各自专业领域的报文却可能看不懂。

如果应用得当,这类技术可以提高不同部门之间的协同运行效率,例如,从网上找来一份气象报文让解读,测试一下它能不能看懂:

好像没什么大问题,再让生成一份航行通告报文,看看它写的标准不标准。可以看到,它听懂了我想表达的信息,基本上完成了任务:

04 不足之处