文心一言正式发布,它能做到什么?和 GPT-4 比呢?我们也问了问 ChatGPT 的看法。
文丨智驾网 黄华丹
在 GPT-4 发布,再次引起一波 AI 生成热之后,今日(3 月 16 日),百度文心一言(ERNIE Bot)也终于正式发布。
同时,今天起文心一言开启测试,用户凭邀请码即可登录使用。
2 月,百度便官宣将在 3 月发布文心一言。但从今天发布会中百度股价表现来看,百度版的 GPT 显然没有满足用户的期待。发布会中,百度港股一度跌破 10%,最终收跌 6.36%。
发布会最让人失望的点应该在于文心一言的对话演示是提前录制好的视频。
不过,考虑到 2 月谷歌在演示其 Bard 时遭遇的翻车,百度选择了提前录制似乎也在情理之中。
2 月 8 日,谷歌在展示 Bard 时发生常识性错误,导致谷歌母公司 Alphabet 股价大跌约 8%,市值跌去 1000 亿美元。百度采用预先录制的措施显然也没让资本买账。
有网友调侃,将文心一言比作 GPT-4 边上的垃圾桶。不过,从发布会上的演示来看,虽然文心一言的功能要和 GPT-4 抗衡还有一段距离,但单独作为大模型来看,表现也算可圈可点。
01.
五大场景下的文心一言
我们先来看文心一言能做到什么。
发布会的演示视频展示了文心一言在五大场景下的表现,分别为文学创作、商业文案创作、数理推算、中文理解和多模态生成。
文学创作场景下,文心一言被要求回答关于《三体》的相关问题,并要求对续写,以及从哲学角度续写提出建议。文心一言回答如下。
商业文案创作方面,提出的要求是为公司起名字,写 Slogan,以及写新闻稿。文心一言完成连续三次内容创作。
数理推算给出的题是鸡兔同笼,首个问题被文心一言反问 " 是不是题出错了?" 纠正后文心一言给出解题过程和答案。
中文理解方面,对文心一言的要求是解释 " 洛阳纸贵 " 的意思及经济学原理,并就成语写一首藏头诗。
这些方面应该说是大众对生成式 AI 应用最熟悉的领域。
比较有亮点的是多模态生成场景。根据要求,文心一言已经能生成文字、图片、音频和视频。而且,在音频展示时,文心一言使用的还是四川话。
目前的测试版本已经包括文字、图片和音频生成能力。不过,由于生成视频成本比较高,还没有对所有用户开放,未来会逐步接入。
李彦宏表示,多模态是生成式 AI 一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。
AI 的发展深不可测,作为 OpenAI 的后来者,百度在发布文心一言时措辞也显得颇为谦虚。李彦宏表示,从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。
但整体而言,这类大语言模型还远未到发展完善的阶段,有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的 bug,进步空间很大。未来这段时间它一定会飞速发展,日新月异。
02.
ChatGPT 怎么看?
至于近期刚刚更新的 GPT-4,已经有不少媒体详细介绍了其强大的 AIGC 能力,此处我们只简单进行介绍。
1,GPT-4 的记忆增加了 10 倍,窗口可以记住 25000 字,相当于可以直接给它一本书,让它按照书的内容进行回答。
2,能够识别图片,输入图片,可以解释图片内容。
3,逻辑思考能力大幅增加,做数学题也没有问题。
据称,GPT-4 已经以超过 90% 考生的成绩通过美国律师考试。而在演示视频中,只需手绘一个网站的草稿,将它拍照喂给 GPT-4 后,就能直接生成网页代码。
不过,GPT-4 的发布并没有涉及更多的技术细节,也没有公布参数量。
从这些能力来看,文心一言还有很大的差距。此外,李彦宏也坦言,目前文心一言的能力还主要在于处理中文,在英语能力上和 GPT-4 有较大差距。
不过,也如李彦宏所言,作为内容生成 AI,未来文心一言还有很大的发展空间。而且,百度作为继 OpenAI 后,全球首家正式发布内容生成 AI 大模型的企业,从展示效果来看,也是值得肯定的。
由于暂时还无法测试文心一言,我们只能调戏一下 ChatGPT,问了问它如何评价文心一言。中文版提问和英语版得到的回答稍有不同。
中文提问版:
可以看出,ChatGPT 认为文心一言更多的是一个针对文学领域的短文本创作工具。
英语提问版,为方便阅读已自动翻译成中文版。
可以看出中文版与英语版的区别还是有些明显的。
最后,我们又问了下它如何评价百度和 OpenAI。
百度和 OpenAI 的共同目标为视为使用人工智能来增强人类的能力和帮助解决复杂问题。
03.
上车会怎样?
李彦宏表示,在人类进入人工智能时代后,IT 技术的技术栈发生了根本性变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。而文心一言就位于模型层。
基于百度在四层架构均有产品布局的优势,文心一言在训练时能大幅提升效率,同时降低成本。
2019 年百度便推出文心大模型 ERNIE 1.0,目前已进化至 ERNIE 3.0。
据李彦宏表示,目前已经有 650 家伙伴加入文心一言。而未来,作为一个通用的赋能平台,文心一言也将用于金融、能源、媒体、政务等各行各业。
李彦宏认为大模型时代将产生三大产业:
第一类是新型云计算公司,其主流商业模式从 IaaS 变为 MaaS。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业 Konwhow,调用通用大模型能力,为行业客户提供解决方案。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
作为能提供交互的大模型,文心一言与 GPT-4 在车上的应用也非常值得期待。
此前,集度也已经宣布将搭载文心一言。同时,即将于 3 月 18 日上市的长安逸达也已官宣将搭载文心一言,成为国内首款搭载 " 文心一言 " 的量产车型。不过,目前并没有公布具体的细节。
此外,包括岚图、红旗、吉利、长城、零跑等多家车企均已表示将接入文心一言。
而 ChatGPT 方面,不久前,Teslarati 刚刚曝出通用或将成为首搭 ChatGPT 的品牌。
据报道,通用正在使用微软的 Azure 云服务和 OpenAI 的技术开发一款新的虚拟汽车助手,由 ChatGPT 背后的人工智能语言模型提供技术支持。
除了能和用户进行语交互,整合了 ChatGPT 的虚拟助手还可帮助车主获取车辆使用的相关信息,或从日历中整合日程安排提醒车主待办事项。例如,聊天机器人可以在仪表板上出现诊断灯时建议驾驶员采取什么行动,或在车辆信息娱乐系统上通过视频演示来指导用户如何更换爆胎。这将大大提高车辆的智能化水平。
而不久前,宝马在财报会议上又进一步展示了其数字概念车 Dee,车主在车外即可与车辆进行对话。
未来,配备了人工智能和自动驾驶的车辆,将真正成为人类的陪伴者,而不再仅仅是车的角色。
【关注智能汽车,关注智驾网视频号】
还没有评论,来说两句吧...