大语言模型中国赛道,谁将胜出?

作者 | 财经E法 王梦欣 樊朔 编辑 | 郭丽琴  

2023年02月24日 08:25  

本文4664字,约7分钟

百度成为第一个公开宣布“All in” ChatGPT所代表的大语言模型赛道,并公布技术落地方案与时间表的中国企业。

伴随全球科技巨头谷歌、微软等陆续公开发布类ChatGPT聊天机器人项目,越来越多的中国企业和机构也宣布跟进,但对于如何落地,均未透露细节。

正如财经E法在2月17日发布的文章(OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?)所述,中国内地和中国香港的手机号均无法注册ChatGPT账号。此外,虽然OpenAI的应用程序编程接口(API)已向161个国家和地区开放,但不包括中国内地和中国香港。

2月22日,百度创始人、董事长兼首席执行官李彦宏率先宣布,百度将抓住即将到来的AI拐点,计划将多项主流业务与类ChatGPT的新一代大语言模型“文心一言”整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等。

在ChatGPT很可能不会对中国内地市场开放的大背景下,各方围绕类ChatGPT项目能否,以及如何在中国内地市场的落地也产生了颇多讨论。

公众最为关心的是,中国能否生长出具有国际竞争力、更适合中国市场的大语言模型?中国企业是否有实力或独特优势支撑起类ChatGPT项目的开发?哪些中国企业最终能够走出一条可落地的商业赛道?

本文试图通过采访国内外众多资深法律、科技学者,投资人、行业分析师,以及企业代表,一一解答以上问题。

中国的大语言模型之路在何方?

最基本的疑问是,中国能否落地ChatGPT相关技术?中国本土研发出的类似ChatGPT的大语言模型,与国际上的差距几何?

首先,综合各方面因素,OpenAI很可能不会进入中国内地市场。

一位不愿具名的在美资深法律人士向财经E法表示,ChatGPT未向中国内地及中国香港用户开放注册,可能是OpenAI综合各项因素后作出的商业决策。其中,尤其涉及到OpenAI和微软的法务人员对于美国外贸管制法规或“国家安全”事务的解释。

南开大学法学院副院长陈兵则对财经E法分析称,ChatGPT不向中国内地和中国香港用户开放可能有两个原因。一方面,OpenAI可能是出于对大语言模型类技术和商业秘密的保护。

另一方面,也可能由于“数据跨境”的原因。中美之间的数据规则不同,ChatGPT实际上也是算法的更新和创新,而算法的运行需要依托数据。如果数据无法互通,那么数据跨境流通就会出现很多问题和困难。

陈兵认为,短期内ChatGPT不太可能进入中国。他指出,一方面, ChatGPT是一个语言模型,在对语义的分析中可能会抓取一些涉及到国家安全的信息;另一方面,ChatGPT实际上是AIGC(人工智能生成式内容)的工具,人工智能生成内容本身即带有很强的价值传输的属性。因此,除了在商业利益方面,ChatGPT的使用、内容的传输可能会对价值观和主流观点造成影响,甚至会涉及到国家安全问题。

前述在美法律资深人士认为,2022年10月12日,拜登政府发布的《美国国家安全战略》已经明确,人工智能、半导体芯片、大数据是中美竞争的重要领域,会受到严格管制。美国头部人工智能企业在综合考虑运营风险后,在可预见的未来,只要这个政策不变,进入到中国内地及中国香港市场的可能性“应该会相当低”。

中国政府总体对国内企业打造相关产品成支持态度。比如,2月13日北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年要全面夯实人工智能产业发展底座,支持头部企业打造对标 ChatGPT的大模型,着力构建开源框架和通用大模型的应用生型。

这意味着,国内头部科技企业将从中获得更大机会。

无码科技创始人冯大辉曾撰文指出:“ChatGPT 的出现,对于这个领域的中国参与者而言,其意义在于验证了 LLM(大语言模型)的可能性。”冯大辉认为,国内外公司在技术上的差距并不大。国内公司其实在大模型方向追得很紧。如果只看模型参数规模的话,现在已经具备万亿参数的能力,甚至还更高,实际差距不到 1 年的时间,“技术方向上并不存在高不可攀的技术门槛。”

至于哪家公司会脱颖而出,冯大辉认为可以从五个方面来进行评估。那就是算法、算力、数据、产品、场景这五个维度。

据冯大辉分析,百度在算法、算力、数据、场景方面都具有优势,还可以在产品化能力上进一步提升。这一点李彦宏也曾公开说道:“怎么把这么酷的技术变成人人都需要的产品,这一步其实才是最难的。”而产品化能力对于各方来说都是挑战。

前经纬创投副总裁庄明浩认为,类ChatGPT这种AI交互方式的产品,大概率还是百度率先推出,但是涉及到大模型,以及将大模型应用到自己的业务里,则还有更多可能。

在国内,百度、阿里、华为、腾讯均已布局AI大模型赛道。

2019年3月,百度率先发布预训练模型ERNIE1.0,并提出行业大模型,构建大模型工具与平台,探索产品与社区。目前,百度已构建了文心大模型层,包含36个大模型,形成了基础、任务、行业三级模型体系。目前,百度自研的多源异构知识图谱,拥有超过5500亿条知识,被融入到文心大模型的预训练中。文心大模型已应用于百度搜索、信息流、智能驾驶、百度地图、小度等产品;通过百度智能云在制造、能源、金融、城市、传媒等行业广泛应用;通过大模型工具平台、开源开放的模型与服务,已有近百万开发者使用文心大模型。在“文心一言”之前,百度即已推出生成式AI产品“文心一格”。

2022年4月,华为云发布了盘古系列超大预训练模型,包括中文语言(NLP)、视觉(CV)大模型,多模态大模型、科学计算大模型。 

2022年4月,腾讯的“混元”AI大模型首次亮相。2022年9 月 2 日,阿里巴巴发布了其最新的“通义”大模型系列。为了实现大模型的融会贯通,阿里达摩院构建了 AI 统一底座,实现模态表示、任务表示、模型结构的统一。

哪些中国企业更可能胜出?

艾媒咨询CEO兼首席分析师张毅向财经E法表示,在中国,布局ChatGPT的企业有两种类型:第一种是传统的互联网大公司,第二种是一些初创企业。

截至发稿前,有百度,阿里、腾讯、京东、网易等头部公司相继透露加入这一赛道的消息。诸多创业家们,也宣布加入,希望打造出一个对标OpenAI的中国公司。

除了产业界,学界也要跟上这波热潮。

2月20日,复旦团队发布了国内首个类ChatGPT模型MOSS,邀公众参与内测。MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。 

为什么中国的公司如此积极?庄明浩认为, ChatGPT的出现向中国企业证明了按照这个方向和路子走是可以拿到结果的,所以他们才会密集加入,并容忍一定程度的沉没成本。

在各界对于ChatGPT以及大语言模型的热烈讨论之中,百度的动作最为迅速且引人注目。

2月7日,百度(NASDAQ:BIDU,9888:HK)成为第一家公开宣布将发布大语言模型产品文心一言与落地时间表的中国企业。由于百度针对“文心一言” (英文名ERNIE Bot)的落地计划,与微软颇为相似。伴随微软的商业变现计划逐步明晰,也引发各方猜测百度“文心一言”在中国可能实现的商业前景。 

此前,有知情人士向财经E法透露,面对ChatGPT类型技术,谷歌是被威胁者,而百度是受益者。一方面,在技术上,中国能做出大语言模型应用的公司少之又少。AI技术架构分为芯片层、框架层、模型层和应用层。百度都做了全栈布局;另一方面,大语言模型产品目前最好的商业应用就是搜索,这刚好是百度一直以来的基本盘。

2月22日,百度发布了截至2022年12月31日的第四季度及全年未经审计的财务报告。

财报显示,2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增长10%。第四季度,百度实现营收330.77亿元,归属百度的净利润(非美国通用会计准则)53.71亿元,同比增长32%。2022财年,百度核心连续四个季度业绩超市场预期。

与往年分散介绍各个业务线的情况颇为不同的是,今年财报整体聚焦于“文心一言”。

在发给百度全员的内部财报信中,李彦宏宣布,百度将抓住即将到来的AI拐点,计划将多项主流业务与新一代大语言模型“文心一言”整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等。此外,百度将开放“文心一言”大模型,支持更多企业构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,实现生产效率的大幅提升。在当晚8点半开启的业绩报告会上,李彦宏还给出了落地时间。“会将‘文心一言’与百度搜索相连接,并于3月向公众开放。”

李彦宏在信中表示:“中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。” 

财报发布后,百度美股盘前一度涨超6%。

在发布财报当晚的业绩报告会上,分析师们针对ChatGPT和百度“文心一言”密集提问。百度管理层回应称,在技术方面,IT技术的技术栈分为四层:芯片层、框架层、模型层和应用层。”百度是进行全栈布局的人工智能公司,且是在中国语言模型方面领先的人工智能。而在商业机遇方面,通过将“文心一言”整合到百度服务中,用户的粘性将会增加,给百度带来更多机会。文心一言功能应该会吸引新用户和广告商,促进长期营收增长。

百度针对“文心一言”的落地计划,与微软颇为相似。而微软的商业变现计划,也引发各方对“文心一言”商业前景的兴趣。业绩会上,百度管理层表示,“文心一言”将会有两种变现方式,一种是通过与搜索引擎整合,提升用户体验和粘性,吸引新用户,再提供相应的产品,比如短视频,给个人付费用户;一种是提供框架给合作伙伴,让其能够开发自己的应用模型和程序。

除了以上两种商业模式,庄明浩认为,“文心一言”还可能通过API调价或者给企业部署私有的、定制化解决方案来获得商业变现。人工智能学会专家顾问郭涛则表示,除了将“文心一言”嫁接到搜索引擎的直接变现方式,其还可以通过给智能驾驶、电商、云服务等百度生态体系内的产品提供大模型服务来实现间接变现。

由于汉语的特殊型,国内企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文璿日前在接受媒体采访时指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文璿解释说,国内人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。

2月22日,李彦宏在财报电话会上指出,百度的大模型可以被认定为最先进的中文语言模型,不止是语言,还有百度对中国文化的深入理解,本土化的大模型将会更加适应中国语言语境和中国市场。大型语言模型未来有非常多的收入机会,在宣布推出文心一言后,不同类型的企业向百度表达了合作意向。

百度官方信息显示,目前,与百度文心一言达成合作意向的生态合作伙伴已接近500家。