整理 | 申莉琦
采访、编辑 | 王与桐
无疑是2023年截至目前的关键词。而如我们所知,令人惊艳的AI能力,不仅仅体现在“回答”,更体现在“生成”。
“生成”能力,也是目前国内企业竞相追求的下一代AI发展方向。而秘塔写作猫,就已经进化出了“生成”文章的能力。
成立于2018年的秘塔科技,最早是在法律赛道做翻译,后来逐渐深入写作场景,成为国产版本。
而秘塔写作猫显然并不满足于此。在去年秋天,秘塔写作猫推出了“量子速写”这一文章生成器,很快就获得了广泛的关注,一周时间内达到上万的日活。
今年以来,整个领域不断有新闻发生,GPT-3.5-turbo的API开放、GPT4上线、百度文心一言上线等等。我们采访了秘塔写作猫创始人&CEO闵可锐,一起聊聊了从到,下一个时代的文章工具,应该是什么样。
以下是专访实录,经36氪整理:
36氪:按我个人的理解是:由生成式对话与搜索资料这两部分功能组成,在您看来,这两部分中哪一个是让火起来最重要的原因?
闵可锐:在一定程度上来说的爆火不只是需求上的原因。对于对话式交互领域,学术界一直在发展革新,但对于普通的民众来说,并没有感知。以前在大家印象中能达到30分-40分用户体验的功能短时间提升到了80分-90分,让很多人都感到震惊,造成广泛的自传播。实际上,在去年9月份我们推出小程序速写时,也让很多人感到惊喜。
36氪:我最早接触你们,是因为你们的文本纠错能力;去年年底你们又推出了智能写作的功能;但据我们所知,秘塔最早涉足的是法律翻译相关的领域。作为秘塔写作猫的CEO,您能分享一下您创业的历程,以及秘塔科技写作猫的发展迭代逻辑吗?
闵可锐:一直以来我从事的都是研发相关的工作,早在2013年时我创立过另一家公司做自然语言处理,在B端有一定的影响力。2018年起,我们开始了秘塔这个项目。在秘塔刚创立的时候,我们就已经料想到新一代以深度学习为代表的技术,能达到准专业级脑力劳动上的效果,就像现在大家都在讨论的。可能在此之前大家对人工智能的理解还停留在小爱同学的级别,你发出的一些比较标准的指令能够得到满足,但只要超出这个的范畴,它就束手无策。而现在的出现相当于给全民做了一个AI能力的普及。
18年起,我们就在朝这个方向努力,选择了法律这个领域切入,因为这个领域本身就具备付费的意愿与能力。在做跨国交易的时候,律师可能需要花费两三周的时间进行翻译与校对的工作,这就体现了human 能够被替代的单点,且有意愿付费。就算在较好的律所里配有专职的翻译团队,单价却非常昂贵。这就促成了我们第一个产品落地的定位,就是把翻译这件事做好。
19年我们发布了第一个翻译产品,当时还在北大法学院举办了相关活动,通过邀请资深的律师和公司法务观摩不同学校代表队与AI进行PK,让大家直观地感受到了目前机器的翻译能力已经达到一个专业的水平。随后基本上国内顶级的几百家律所也陆续成为了我们的客户。
为了使用机器帮助减少重复性脑力劳动的工作量并提高工作的效率,我们在2020年的时候推出了纠错校对的产品。对于一些白领来说,跟大量的文本打交道是不可避免的,无奈的是,市面上并没有一个好的产品去帮助他们进行一些纠错润色或者校对提示。传统的Word也达不到上述的要求。
36氪:我使用中文时,出现错别字、语法问题,从未被Word提示。
闵可锐:Word在十几年前集成了这一套基础的语法检查体系,对于英文还行,但在中文这种语法不那么规则化的语言面前是很难施展的,由于中文语法本身的高度模糊性,导致市面上一直没有比较流行且靠谱的产品,这恰恰是新一代技术可以施展拳脚的地方。基于我们对形势的判断,三年前我们发布了我们第一个版本的写作猫,很大程度上减轻了文字工作者的苦恼。
近两年,我们也逐步加入了针对英文的检查与改写润色。在整个过程中,我们也意识到了很多用户的价值感知最高的,不是帮助他找出文章的错误,而是帮助他从0到1生成文章,或给他一些ideas与灵感上的启发。
36氪:那是怎么想到做文章续写、智能写作这方面的事情呢?
闵可锐:我们起初做纠错这个产品时,在海外对标的是09年成立的公司,它花了大概十余年的时间让营收达到了小一亿美金的级别。
而AI应用公司————利用新技术作为杠杆,加上自身对营销的理解,在创立短短的两年时间里就达到了接近一亿美金的规模,可见AI的价值。
学术上证明了GPT可行性后,公司又在商业上证明了这件事的可行性。
因为我们自身有相关技术储备,在去年下半年推出了一个叫量子速写的小程序:哪怕你只输入一个标题,我们也能给你生成2000字并具有完整逻辑的文章。事实证明反响还不错,也验证了AI写作的直接需求。
量子速写的生成文字
量子速写的生成文字
后续我们也在不断进行优化与模型迭代,去年11月份时,写作猫正式从“你来写我来改”的模式变成了一个更一体化AI写作平台。
营销宣传的团队,在使用写作猫之前,人工一天可能写出上千字,而使用写作猫后,客户只需要定义好需要的描述或卖点,我们就可以为我们的客户生成一批相关的文案,就算客户后续再手动地进行修改与调整,速度上也会比原先单纯使用人工去完成任务更快。
现在看来,去年国内市场还是比较安静的。相比较之下,海外从2021年起便涌现一系列创业公司借助的API开放应用层产品。
36氪:不久前有很多人提到会取代,您对此有什么想法吗?从逻辑上来说是可行的,但这样更好的生成式技术,用于检查语法、错字,是不是相当于用牛刀杀鸡呢?
闵可锐:如果这把牛刀足够便宜,杀鸡也是可行的。和小模型相比,就算大模型的成本上存在几十倍的差异,这些差异最终在客户端都被抹平。
我在团队内部里也提到,如果一个工具能提升20%-30%的效率,那么它可以被定义为一个良好的工具;如果它能提升高达30倍的效率,这时大概率会遇到伦理问题。
目前的定位与追求是辅助者,而不是帮助用户直接生成文章,毕竟大幅提升效率的新产品难免会和传统价值观产生一定的冲突。这也是没有选择快速转型的原因。但是,当人们发现一件事10秒就能完成时,便不愿再花费10分钟去完成。在现在这个时代,一旦潘多拉魔盒被开启,就很难再把它装回去。
36氪:所以您也是会认同会被取代这种观点?
闵可锐:这还要取决于他们自己的营销策略,毕竟目前为止他们还拥有一个比较广泛的应用群体。但如果只专注于帮助用户检查错误,会受到具有更综合功能产品的挑战。
36氪:目前AI对话、AI写作领域的实践模式,大多是搜索加语料库的路径,你们调用的路径是与不一致的吗?你们使用的数据又是从何而来的呢?
闵可锐:我们从2018年成立,产品所用到的模型均为自研。在前GPT3时代,生成式的内容很不靠谱,会有各式各样低级的错误。在大模型基础上,我们进行一系列良好的训练与工程的优化后,写作猫长文生成质量达到了实用级别。对于数据方面,我们使用的都是全网各种新闻网页或其他公开资料洗出来的高质量数据。
36氪:我们之前试用过mini max公司的旗下产品glow,发现其对话风格与近年来流行的剧本杀风格类似,那么它们的数据来源又是什么呢?
闵可锐:网络小说。在中国有着极其丰富的网络小说资源,这个量级在全球范围内都首屈一指。中国目前网络小说存量加起来比训练GPT3的数据还要多。
36氪:前段时间,宣布开放的API接口,对于这件事您怎么看?
闵可锐:在我看来,它的商业推进速度是非常之快。并且这套定价体系的出现,会让很多全球范围内跟处于一定竞争关系、使用类似商业模式的公司感到十分难受这也是在12个月里第二次降价, 总计下调到了1/30,这给所有其他想要利用大模型并提供上层API调用的公司而言无疑是巨大的压力。且不论你的模型无法与之相比,在定价时,它采取的甚至不是以获取正向利润为目的定价策略。
36氪:这种策略与中国互联网滴滴美团这些公司十分类似。
闵可锐:这其实是一个非常激进地去普及其API的方式,在一定程度上来说,这个方式可能也是行之有效的。微软投入的巨额资金,其中的大部分也会在自己平台上重新被使用,所以也算是收入的一部分,或者更通俗来说,可以看成是一种优惠券,换来的可能是市场上绝对优势的垄断地位,这就让其他公司很难再通过类似的模式赚取利润。
36氪:正如您之前所说,开放API接口会让很多公司难受,但主要提及的是海外与其采用类似商业模式的公司。您认为对于一些国内相关领域的公司,他们难受的点在哪里呢?
闵可锐:我认为,我们国内是需要自主自研的可控大模型的。但单从商业角度来说,我很难想象国内的公司和它在市场上进行价格上的竞争。
我自己原来也在和微软等公司实习,很多时候大公司从研发到推出产品的流程需要以年来计时。我们已经很多年没有见到像微软这样体量的企业,每周都会对其主产品线做更新,并把它的技术提升应用到它核心的产品线,包括Bing的搜索上。
36氪:目前大模型的API已经可以调用,在价格还比较低廉的情况下,秘塔写作猫会考虑接入吗?
闵可锐:我个人的观点是,如果我们现在面临的是30门全科能力的考试,确实有机会通过它的规模与算力在综合性的30门考试中取得比我们更好的成绩。而我们的优势在于我们直面用户,解决特定刚需场景问题,在我们重点关注的领域做到比它们好。
36氪:那我可以理解你们团队是对标的而不是吗?
闵可锐:就目前来说,我们不愿意提所谓对标这类逻辑。在一个月内,有太多公司从资本市场冒出并公开表明对标。我们保持敬畏。
36氪:我会倾向于把你们类比成中国版的,如果中国版的,也就是百度的文心一言成功上线,对你们公司会产生冲击吗?
闵可锐:首先,我们也很期待在这个节点上百度推出的产品展示技术能力;如果百度希望做成中国版的,那与我们其实不会产生直接冲击。我们希望我们的产品更贴合专业且具体的场景,而更像是一个好的技术而不是一个收费的工具。
36氪:目前有很多投资人认为是一个很好的标的,那么 这种模式在中国国内是可以复制的吗?
闵可锐:我们目前所看到的情况是,在国内不论你针对什么环境,与国际市场的付费意愿相比而言是糟糕的,但不可否认偏营销端的产品相对来说更好。很多公司并不愿意为单纯具备管理职能的软件每年支付上万元,可如果某产品能为公司带来可量化的1万新增用户,那公司就很有可能为其买单。他们可以选择使用较小的金额去验证产品带来的效果,当发现效果不错以后,他们也会相应地投入更多的金额。
36氪:了解了你们在应用层面与有较大差别以后,我想知道如果在投资到位的情况下,你们会选择去扩张团队的规模,在底层技术去追赶它们;还是会选择把更多的精力放在实际应用这个方面呢?
闵可锐:底层技术是我们一定会去不断投入的方向,但对于是否需要千亿模型这件事,我们的态度是不一定。
36氪:那您认为最有决定效果的方面是什么呢?
闵可锐:我们之所以认为很强的重要原因是在它达到85分效果需要完成的这100件事里,每一件事它都没有短板。我们会去探索更高的参数量,评估其必要性千亿模型对成本来说是一个负担,在接近的应用效果方面,我们会希望它越小越好,而不是越大越好,因为后者会带来更大的成本。
就像最近也在训练一些较小的模型并利用它们达到千亿级别的效果。所以理论上可以在更小的规模上达到2020年GPT3版本的训练效果, GPT-3的1700亿参数训练并未充分。
36氪:未来的API广泛应用于中国市场的话,你认为会不会涌现出很多做相同事情的厂商?
闵可锐:我相信这是不可避免的。从2020年起,市场上就有大量试图模仿我们的产品,虽然效果有显著差异。
无论是国内还是国外,竞争是常态。但凡是有价值的领域,就会有很多公司参与竞争。
36氪:您作为公司的CEO,在新的一年里对公司有什么具体的规划吗?或者换另一种说法,当你们今年只能做好一件事时,您希望公司更看重商业化还是技术,或者其他别的选项?
闵可锐:我们始终会考虑把商业化和技术两件事捆绑在一起完成,希望我们在生成能力这项技术上的投入能直接反哺到客户数量的增长,提升客户的满意度与复购的意愿,然后我们才能有更大的资源让客户了解到我们,这是一个正向循环的过程。验证大家是否认可你最简单的方式就是用钱投票。
发表回复