百度文心一言会带来哪些新机会?

作者 | 《财经》记者 刘以秦 顾翎羽    编辑|谢丽容  

2023年03月17日 18:07  

本文3911字,约6分钟

对于大部分创业者和企业来说,新的机会在于基于新的技术平台开发新应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用

2023年3月16日,百度启动生成式对话产品“文心一言”邀请测试。这是国内第一款对标ChatGPT的生成式对话产品。当天,百度创始人李彦宏说,大家对它的期望值是对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。

3月16日,百度新闻发布会后,百度港股股价单日跌幅6.4%。3月17日,股价回弹,单日上涨13%。

李彦宏在现场接受《财经》记者的采访时表示,内测中“文心一言”并不完美,之所以现在目前这个节点发布邀请测试,主要两大原因:一是去年开始全球人工智能技术发展从过去的判别式AI(数据库比对)转为生成式AI(生成新内容),百度加快研发脚步,近半年市场验证了这个判断;二是更多的机会出现在了生成式AI这些方面,无论是百度内部产品还是合作伙伴都有强烈需求。

全球最先在生成式对话领域掀起风浪的是微软投资的美国创业公司OpenAI。该公司在去年12月推出的基于GPT-3.5大模型的ChatGPT火爆全球,3月15日OpenAI进一步推出新升级的GPT-4大模型,相比前一代有了不小的提升;3月17日,微软在发布会上宣布,将GPT-4的能力融入Office系列产品。AI大模型的特点是能够在更宽泛、更大规模的数据上进行训练,效率更高,学习能力更强,但耗费资源更大。

ChatGPT火爆后,多家公司宣布也在研发类似产品,百度是目前中国头部科技公司中第一个落地产品的。文心一言基于文心大模型技术。2019年,百度推出文心大模型ERNIE1.0,2022年11月,该模型进化成3.0版本。李彦宏称,文心大模型每天接受数十亿次用户搜索请求,这也为文心一言提供了庞大的数据池。

生成式对话产品并非一个全新形态的产品。它的典型同类产品是对话式AI产品,包括各类语音助手、聊天工具等。第三方数据机构IDC数据显示,2022年,对话式AI市场规模达到54.6亿元,市场渗透率已经饱和。但此前的产品并未引入大模型,新一代产品的出现,将重新激活市场。

文心一言除了能够生成文字内容,还能生成图片、音频和视频内容,由于成本原因,文心一言的视频生成内容暂未对外开放。

无论是ChatGPT还是文心一言,目前都是比较初级的产品,且尚未找到清晰的商业模式,这也是目前行业里最关心的话题。ChatGPT是面向C端用户收费,但依然严重亏损,2022年全年预计亏损5.4亿美元,且用户量越大,亏损越严重。百度目前对文心一言的定位更偏向B端,李彦宏称,文心一言的定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,创造商业价值。

李彦宏的判断是,生成式AI代表了一个新的技术范式,是一个每家企业都不可以错过的巨大的机会。AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。

据百度官方数据,截至3月17日上午10点,申请文心一言API服务测试的企业已达7.6万家。

某中国AI创业公司CEO向《财经》记者评价,中国需要有自己的大模型产品,从算力、数据、人才储备等方面,百度在中国市场优势明显,尽管目前和美国还有差距,但“必须要有勇气走出第一步”。

有差距也有亮点

新闻发布会现场,李彦宏展示了文心一言的5个场景,分别是:文学创作、商业文案创作、数理推算、中文理解、多模态生成。

《财经》记者对比文心一言和GPT-4针对同一问题的回答,发现文心一言对于中文的理解,在某些时候是优于GPT-4的,例如当问题是病句或容易造成歧义的表述时,文心一言能够理解提问者的意思,GPT-4的回答会有所偏离。同时,它们都存在“胡说八道”的情况,不过,新版Bing中的GPT-4会附上内容来源链接,便于用户二次确认。

文心大模型训练使用的数据以中文为主,因此文心一言能够更好理解中文,甚至能生成不同方言的音频。文心一言也支持英文互动,但效果相对较差,其他语种目前还不支持。

此外,文心一言会选择性回答问题,若问题中涉及敏感词,它会说“我无法回答这个问题”。李彦宏提到,整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的问题,进步空间很大。

大模型训练成本高昂,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。百度拥有全栈式AI能力,从芯片(昆仑芯),到深度学习框架(飞桨),再到预训练大模型(文心),到搜索、智能云、自动驾驶、小度等应用,各个层面都有自研技术。

李彦宏表示,全栈式布局可以大幅提升效率,显著降低成本。另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断优化迭代。

新商业机会

马斯克是OpenAI最早的创始人之一,后期退出。今年2月,他在社交平台上公开批评OpenAI“最初是作为一家开源的非营利性公司而创建的,这也是为什么我把它命名为OpenAI,旨在抗衡谷歌,但现在它已经成一家闭源的营利性公司,并由微软控制……这完全不是我的本意”。

由于OpenAI选择了封闭,只对接微软全系产品,外界将它类比为苹果的iOS操作系统。百度的文心大模型走的是开源模式,类似于谷歌的安卓操作系统。

百度对文心一言的定位是“一个通用的赋能平台”,金融、能源、媒体、政务等行业,都可以基于这个平台来做智能化改造,实现效率提升。

除此之外,按照规划,文心一言也将全面嵌入现有业务中,包括搜索、智能音箱、百度智能云、智能驾驶等。

在搜索场景中,文心一言可以补充、升级搜索体验,类似目前Bing中集成了GPT-4的体验。搜索引擎能以此形成新的流量入口,获得新的数据。在智能驾驶场景中,可以与百度阿波罗自动驾驶舱、车路协调做融合,提升无人驾驶的可靠性。

李彦宏提到,大模型时代将产生三大产业机会:

第一类是新型云计算公司。之前企业选择云厂商更多看算力、存储等基础云服务。未来,框架、模型的质量,以及模型、框架、芯片、应用这四层之间的协同能力,会变得更重要。微软已经将ChatGPT的能力融入Azure云服务,多位业内人士提到,这将有助于Azure提高市场份额,也是微软投资OpenAI的商业回报之一。

在中国市场,目前百度云的市场份额低于阿里云、华为云和腾讯云。不过,智能云是目前百度增速最快的业务,2022年营收同比增长23%,这一增速也高于另外三家云厂商。文心一言的出现,或许能够帮助百度云拿下更多市场份额。

第二类是通过调用大模型能力,为行业提供解决方案的公司。目前文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型,在各行各业都可能创造机会。

第三类是基于大模型底座开发应用的公司,即应用服务提供商。李彦宏说,“今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。”

中国AI大模型进展

基于大模型的生成式AI已经成为新一轮市场热点。数据服务商Dealroom报告显示,全球生成式AI企业估值已达480亿美元,在过去2年里翻了6倍。

中国投资人和创业者们也已经入局。前美团联合创始人王慧文成立AI公司“光年之外”,多家知名投资机构立即跟进,天使轮估值已经达到2亿美元。一家在几年前就开始做大模型的AI创业公司,一度无人问津,近期该公司创始人告诉《财经》记者,几乎每天都有不少投资机构来询问是否接受融资。

目前,中国初创公司中,能够做出真正有影响力产品的还很少。多位投资人表示,短期内能够看到实际应用效果的,可能是抖音、快手这类视频平台。目前,字节跳动和快手均有布局AI大模型和生产式AI。

其他头部科技公司中,腾讯、阿里巴巴、华为也在行动。2022年4月,腾讯对外披露“混元”大模型,协同了腾讯预训练研发力量,覆盖NLP(自然语言处理)大模型、 CV(机器视觉)大模型、多模态大模型及多个领域任务模型。

2022年9月,阿里巴巴在世界人工智能大会上,发布 “通义”大模型系列,并宣布相关核心模型向全球开发者开源。华为云团队于2021年4月发布“盘古”大模型, 2022年11月,在华为全联接大会2022中国站上,华为云发布盘古大模型的新技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项新服务。

ChatGPT火了之后,中国不少公司都在尝试研发类似产品。但这件事成本极高。OpenAI每年的研发费用高达几十亿美元,GPT-3.5语言大模型包含1750亿个参数,微软为ChatGPT构建了超过1万枚英伟达A100GPU芯片的AI计算集群。GPT-4的参数值在此基础上又大幅提高。谷歌3月6日推出的多模态大模型PalM-E,参数值达到了5620亿。

一位长期关注AI的投资人告诉《财经》记者,中国的创业公司从零去做类似产品,非常不划算,也很难追赶进度,应该将重心放在行业应用上。

另一位投资人提到,由于监管因素,文心一言为代表的国产替代产品未来才是主流。

文心一言的出现,或许能够帮助中国公司更好地理清思路。李彦宏称,对于大部分创业者和企业来说,新的机会在于基于通用大语言模型,抢先开发重要的应用服务。“就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。”