百度文心一言今日开放邀请测试 李彦宏称大语言模型尚未发展至完善阶段

作者 | 《财经》新媒体 王婧雅 编辑 | 高素英  

2023年03月16日 15:52  

本文1036字,约1分钟

3月16日,对标ChatGPT产品的百度“文心一言”正式对首批用户邀请测试,后续将陆续开放给更多用户。同时,百度智能云即将面向企业客户开放文心一言API接口调用服务。

百度创始人、董事长兼首席执行官李彦宏介绍并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。李彦宏坦言,这类大语言模型远未到发展完善的阶段,还是有很多不完美的地方。之所以选择现在发布,原因在于百度的产品和客户有需要。

从现场展示来看,文心一言在某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。在在文学创作、商业文案创作场景中,文心一言可以根据对话问题将《三体》核心内容进行总结,并提出续写建议角度;同时,文心一言还可以完成给公司起名、写Slogan、写新闻稿的创作任务。

尤为重要的是,文心一言已经具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并识别出问题的错误。在收到正确问题后,文心一言可以像学生一样,按照解题步骤,一步步算出正确答案。

不容忽视的是,多模态是生成式AI一个明确的发展趋势,在此场景中,文心一言也具备了生成文本、图片、音频和视频的能力。不过,李彦宏表示,由于文心一言的视频生成能力成本较高,现阶段还未对所有用户开放,未来会逐步接入。

李彦宏认为,文心一言这类大语言模型会成为每个人必不可少的生产力工具。但无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。

目前,IT技术的技术栈已从过去芯片层,操作系统层和应用层三层分层演化至芯片层、框架层、模型层和应用层四层分层。文心一言正处于模型层。

据李彦宏介绍,早在2019年,百度就推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。 

需要指出的是,大模型训练离不开大算力、大数据和大模型支撑,每一次训练任务都耗资巨大。

李彦宏认为,全栈布局的优势在于可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨研发了 4D 混合并行技术。另外,芯片、框架、大模型、和终端应用场景,可以形成一个反馈闭环,帮助大模型不断去调优迭代。