3.16号,百度公司CEO李彦宏发布了“文心一言”,因为没有进行现场演示,有相当多的人对“文心一言”的能力并不看好。

3.17号,超曲速公司获得了百度“文心一言”的内测邀请,借此机会,我们测试了一下文心一言的能力,同时也对比了,微软New Bing,以及华为的”盘古模型“(仅看到ppt上的文字截图反馈,并未实测盘古大模型);

首先对于百度“文心一言”的效果,我们先给出一个整体的结论:百度”文心一言“,基本达到了可以使用的程度;整体效果比差一点点,主要体现在文字组织表达的拟人上略差,内容的专业性略差。但是在中文内容的生成上是比好一点点,特别是图片的生成方面。

对比百度“文心一言”,以及华为“盘古大模型”(仅看到ppt演示,未实测),两者整体相当,各有千秋;百度“文心一言”在文字组织表达上比盘古大模型要好一些,盘古大模型相对而言语气生硬一点;但是在图片生成方面,“盘古大模型”又优于“文心一言”。

一句话总结,百度的”文心一言”基本可用,达到了GPT2的水准;我们觉得,李彦宏同学在发布会完全可以大大方方的进行“文心一言”的演示。

下面来列举一下部分测试效果和说明:

这里的答复的语言结构比较类似,但是明显数据有误,超曲速公司成立于2022年;

对比祭十二郎文和祭妹文_雅沫心整容对比_文心一言与chatgpt对比

这里的答复,更多的偏重于大数据的能力体现;实际上AIGC可以帮助HR更好地发布招聘信息,帮忙生成企业介绍,招聘要求等等。

这个问题在不同的平台都遇到过,并非只有百度“文心一言”有这个问题;基本上都是把“红烧肉”的做法中,“肉”这个字替换成了“插线板”。

这个问题在去年12月份的时候,还不能给出正确的答案,后来被修正了;百度“文心一言”直接给出了正确的答案,应该做过特别的训练。

这个回答,有亮点也有不足;

亮点方面是,目前大部分的平台都是基于国外的开源平台构建起来的,图片生成几乎都是生成外国的美女,百度在这方面应该是做了大量的国内图片的训练,图片生成是一个国内特征的女孩;

不足的地方是,目前大部分的图片AIGC技术,都解决不了手指的问题(除了海外个别图片生成AIGC的平台有解决),百度的“文心一言”也存在这个问题。

整体而言,百度“文心一言”没有掉太多的队,相信经过一段时间,“文心一言”也可以逐渐的成熟和聪明起来;