云厂商加速大模型场景应用 产业化落地仍存瓶颈

作者 | 《财经》新媒体 舒志娟 编辑 | 高素英  

2023年05月14日 15:28  

本文3329字,约5分钟

由ChatGPT掀起的大模型热潮仍在席卷,市场竞争加剧下或致产品同质化,与产业融合成为突围“杀手锏”。近日,百度智能云公开表示,文心一言内测近两个月完成了4次技术版本升级,目前已在能源、金融、制造、教育等领域推出36个行业大模型。而阿里通义千问、华为盘古、腾讯混元等也纷纷秀出自己在大模型领域“肌肉”,加速在物流、零售、出行、办公等场景落地。

不难看出,各大云厂商大模型之战的焦点已经由“模型的训练规模”,转向更深层次——既要快速迭代新的能力,又要追求与下游合作伙伴的链接深度的比拼。这也让大模型加速走进产业深处,行业逐渐从最初的“摸着石头过河”走向实践的“中场战事”。

不过,由于大模型真正走入公众视野仅半年时间,处在从实验室走向大规模商业化的早期阶段,面临核心技术不成熟、生态系统不健全、运营成本高等突出问题。如何将大模型与产业化应用无缝连接,并把大模型以高效低成本方式落地到千行百业,成为业界纷纷发力的方向。然而,考虑到研发大模型需要对算力、资金、人才等种种资源进行长期投入,市场势必会经历一番“洗牌”。

大模型竞争进入新阶段   大厂AI能力之争提速

过去的2个月,国内AI大模型领域按下发展的加速键。

百度文心一言内测一个多月,完成了4次技术版本升级,大模型推理成本降为原来的十分之一;阿里云的通义千问已接入企业办公等场景,钉钉生态率先开启大模型赋能智能办公;华为盘古大模型开源开放,在物流、药物研发、气象预测等多领域已探索落地;腾讯混元大模型则已融入内容创作、对话式智能助手等场景……

从整个赛道来看,大模型的战火不只是燃到模型的训练规模层面,而是转向技术迭代速度、服务场景落地和客户获取速度的较量。

百度智能云方面表示,截至目前,有超15万玩家企业申请加入文心一言内测。而在3月16日文心一言公开发布当天,这个数字是650家。而据阿里云方面披露的最新数据,目前超过20万企业用户申请接入通义千问测试,覆盖新兴和传统行业。

在业内看来,大模型之争本质上是大厂之间AI能力之争。对于百度智能云而言,则是深度关联到包括搜索引擎、智能云、自动驾驶等在内的所有核心业务,有机会演变为真正激活全盘智能业务的关键所在。而对于阿里云来说,商业化到了变革的关键节点,亟需找到新的增量市场,而大模型有望改变云增长持续放缓的局面,打开新想象空间。

入局者激增竞争加剧  产业融合成突围利器

大模型竞速赛愈演愈烈,据不完全统计,目前国内云厂商、创业公司、科研院所等发布的AI大模型产品已接近40个。然而,随着大模型领域参与者数量的增加,可能导致市场竞争加剧和产品同质化现象。

那么,面对越来越内卷的竞争现状,云厂商们如何才能在“百模大战”中突围?对很多企业而言,在大模型风起之初,接触大模型厂商时,主要的诉求是尝试一下。但是,随着技术的不断迭代,不少企业已经意识到,大模型对每个人、每个行业都有结构性影响,他们更迫切地关注如何把生成式大模型的能力利用起来,让其在业务上可以再上一个新的台阶。

对此,云厂商们给出的答案是与产业的融合,谁的场景落地更快,谁的成本更低,谁就具有更强的竞争力。值得关注的是,包括百度智能云等在内的玩家,已经开始将大模型能力引入到云计算全线产品中,和TO B端高度关联的智能客服、办公提效等各行业通用的高频需求场景,将成为各大云厂商交锋的关键战场。

在电商行业,直播带货是当前每家企业不会错过的风口。但对于一些中小企业来说,随着直播团队人员薪水、设备的价格水涨船高,许多商家养不起专业直播团队。而现在,大模型就可以帮助企业做出不同风格的直播口播内容,再结合数字人技术,用AI主播可以做到24小时直播。百度集团副总裁侯震宇表示,经过度量,它的转化率是无人直播的两倍。

另一个更易被感知的场景是智能客服领域。侯震宇进步一称,“客服领域是一个很严肃的任务型对话场景,需要解决真实世界的深度复杂问题。同样是6万字的文本回复量,一个人工客服,一天的成本在100-200元,如果将文心大模型引入客服体系,完成同样6万字左右的工作,成本只有1块钱。”

在政务方面,大模型可以帮助用户更快获得相关部门的回复,提升服务满意度。据京东云方面介绍,产业AI能力正在加速政务热线的智能化,AI将大同市12345的呼入电话接起率提升至100%;将AI和政府热线结合,提升了东莞市受理市民诉求办理满意率达到96.8%。

在业内看来,大模型与产业相结合,所迸发的想象力远远不止于此,未来将带动数字化经济更进一步。不过,随着大模型在各行各业的应用,无论是在C端还是B端,必将科技公司的竞争推向另一个高度。

产业化落地亟待突破  加速行业淘汰赛

不难看出,对于企业而言,接入大模型产品已经从一道选择题变成了必答题。不过,从实际情况来看,目前企业在推进大模型产业化落地过程中仍面临多重难题,模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐。

“在大模型出现前,金山办公在内部上线了一款生成类AI应用,能够生成大纲、PPT等内容。但上线后,员工使用的频次并未达到预期。”金山办公助理总裁田然表示,原因在于,使用过程中实际生成内容时,需要在很大程度上依赖上下文理解,如生成一份周报,需要理解上下文的内容包括员工过去一周涉及的所有内容,反而降低了效率。

田然进一步表示,因此,这就要求大模型厂商将这些异构的内容进行量化,变成可被索引的数据。这一步完成后,如何将数据导入模型,进行预训练、微调,再到能够形成交互,同样考验厂商的综合能力。

百度智能云方面告诉《财经》新媒体记者,解决大模型产业化落地难题,可以采用类似芯片代工厂的模式。具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

而文心千帆提供的模型能力与整套开发工具则能很好地解决了上述难题。有人将文心千帆比喻成是一个“大模型厨房”,企业可以直接端走做好的大模型菜肴成品,再稍微加点自己所需的调料就能端给客户;企业也可以自带食材、厨师,使用文心千帆提供的灶台和工具自己做菜。目前该平台提供公有云服务、私有化部署两大交付模式。

京东云方面在接受《财经》新媒体记者采访时表示,从大模型选择上,可控、可信、可用是核心标准,要选择与产业适配的大模型。而目前通用大模型的重要局限在于不可控,最后输出什么结果很难通过一些模型机制去控制它。但在实际产业应用中,需要做到可控可用,与真实场景结合。

除效果外,运行成本也成为制约大模型产业化落地的重要因素。据潞晨科技创始人尤洋介绍,要想把大模型部署到生产线上,如果一个企业或者单位从零开始自己做,需要的人力为70人左右,而在欧美地区光是养活70个人,成本就需要2000万美元。对于很多企业而言,这是一笔难以承受的成本。

侯震宇指出,对企业来说,做大模型可能有点贵,因为大模型算力成本高。但是使用大模型以及基于大模型底座训练和微调模型的成本已经明显的降低。现在调用文心一言的成本,已经降低到模型刚发布时的10%,以后还会降。

这也倒逼云服务厂商对自己的大模型服务体系进行创新,走出一条高效、低成本的道路。在京东云方面看来,对于大模型厂商来说,不是验证一个模型、发布一个产品就可以了,一定是在产业实践上产生效果,再开放给合作伙伴和产业客户使用。未来,大模型使用或将走向“预训练大模型底座+下游任务微调”的方式。

商务部研究院副研究员洪勇告诉《财经》新媒体记者,未来,大模型领域可能形成多种商业模式,包括模型开源共享、服务化商业模式、行业应用商业模式和联合合作商业模式等。这些商业模式通过开源共享促进技术发展、以及通过资源共享和合作降低研发成本,并且可能会出现多种商业模式的混合形态。但是,在这个过程中,市场势必会经历一番“洗牌”。