国产大模型独角兽新融资,紧追Sora,但非不加思考跟随

文|财经E法 樊朔 编辑 | 郭丽琴  

2024年03月18日 22:50  

本文4801字,约7分钟

智谱AI已形成了四种商业落地模式。该公司CEO张鹏透露,目前已有2000多个生态合作伙伴,1000多个规模化应用,其中与200多家企业实现深度共创。

近期,国产大模型厂商智谱AI宣布已在今年年初完成的新一轮融资,北京市人工智能产业投资基金参与了本轮融资。

在2023年全年,智谱AI已累计获得超25亿元人民币融资,成为国内估值最高的大模型公司之一。

智谱AI成立于2019年,由清华大学计算机系教授唐杰(目前担任该公司技术顾问)创立,核心团队脱胎于清华KEG实验室,团队核心成员曾参与清华大学与智源研究院合作项目"悟道"的研发工作。

大模型赛道自2023年初突然火爆,智谱AI作为中国头部大模型企业因此备受关注。国际科技媒体The Information曾将智谱视为最有可能成为“中国OpenAI”的5家企业之一。

从技术路线上来看,智谱AI 使用的是GLM预训练架构。2020年,智谱训练了百亿参数模型GLM-10B。2022年8月,智谱AI开源了1300亿参数规模的双语预训练模型GLM-130B。2023年3月14日,在GPT-4发布的同一天,智谱官宣了千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B。2024年1月16日,在智谱AI技术开放日上,智谱AI发布了新一代基座大模型GLM-4,性能比上一代提升接近60%,整体评测结果逼近GPT-4,支持更长的上下文、更强的多模态、更快速的推理、更多的并发,大大降低推理成本,同时GLM-4也增强了其智能体(Agent)的能力。

在近期举办的智谱AI媒体沟通会上,智谱AI CEO张鹏表示,ChatGPT的上线给出了明确信号:预训练模型已经到了完全可使用且好用的阶段,是产品化的很好范例。而Sora的出现则代表了此前基于人类语言系统的AI技术正在打通视觉、声音等低级信号,是实现通用人工智能(AGI)的关键。

从产品上来看,智谱AI布局了与OpenAI对标的产品,如AI开放平台、ChatGLM对话模型、CodeGeeX代码模型、AI写作工具“写作蛙”、文生图CogView等。张鹏曾在多个场合表示,智谱AI在与OpenAI做“全线对标”。但他表示,这种对标并不是不加思考地跟随,而是在AGI的一致目标下有着相似的技术积累阶段。

张鹏坦言,随着 ChatGPT 的爆火,很多人纷纷地投身大模型:短期做AI升级,利用大模型来做原来的一些分类、聚类、情感分析等算法的升级;中期研究自己的定制化大模型,或者垂直大模型、行业大模型,比如数学、化学、医疗等领域涌现了很多专用大模型,以及基于现有算法框架训练注入不同数据训练出的各种模型,一下子形成了国内百模大战的场面。但值得探讨的是,“大模型到底怎么用,让它产生更大的价值,商业化落地如何去实现,它的成本、效率等。”张鹏说。

智谱AI在前述沟通会上发布的十个商业化案例显示,其客户分别为德勤中国、分众传媒、华泰金融、蒙牛、上汽集团、金山办公、马蜂窝、华信永道、智己汽车、智联招聘。应用场景包括文件撰写、智能客服、智能助手等。张鹏透露,目前智谱AI在业内已经有2000多个生态合作伙伴,1000多个规模化应用,其中与200多家企业实现深度共创。

智谱AI也在探索中逐渐形成了四种清晰的商业落地模式。而大模型技术的特征,使得大模型商业落地场景与上一代AI技术的落地场景有了本质不同。

在近期的媒体沟通会上,智谱AI CEO张鹏对各方关注的话题一一作答。

Q:在商业化过程中,国产AI大模型与国际的头部大模型相比有哪些优势?

张鹏:中国大模型厂商与国际同行相比,有着非常不一样的基础条件,尤其是在中国做智能软件类的落地会面临着不同的挑战。例如,SaaS(Software as a service,软件即服务)在国外非常成熟、普及,在中国就发展得不太好。其实我们在做大模型的早期,已经开始设想,如何在国内市场去做符合国情的大模型应用落地。

我们的一个理念是MaaS(Model as a service,模型即服务)。我们认为模型本身是一种 AI技术能力的底座,我们希望以服务的方式把这样的能力和底座提供给客户,这里边可能有不同的路径和方式。

面对不同的客户,智谱形成了四种商业化落地模式:

第一种是最轻量级,把模型封装成开放平台,将API开放给开发者调用,按照调用量进行付费。这也是国际市场上的基本商业模式,已经足够简单成熟。

第二种是基于云端算力的云端私有化方案。一些企业要求具有独立的数据保障,而非与大模型企业分享数据,同时不希望自己去维护算力等基础设施。具体操作是利用智谱的云端算力开辟不同客户的专门模型专区,在服务过程中保持其数据与其他用户数据的相对隔离。

第三种是完全私有化。很多国企或其他关注数据安全的行业,会要求数据不能导出自己的系统或是物理边界。智谱AI可以提供私有化落地方案,在客户提供硬件和算力的技术平台上,开发相应的应用,满足业务需求。

第四种是软硬件结合的一体机方案。智谱把模型和国产化的硬件进行绑定,这种适配性可以免去客户环境中部署和实施调试的过程,实现环节一体化的销售和部署。

Q:能否介绍一下智谱AI的云端私有化?

张鹏:这里面涉及到数据安全和隐私保护的问题。

这个事情本质上跟大模型没有必然的关系,它并不是因为大模型出现后产生的新问题,而是在整个信息化、数字化发展的过程中,大家同样面临的问题。企业上云的过程中就是要解决这样的问题,我们也采用了一些方案。比如,跟大家一起建立更完善的监管机制,遵循法律法规以及客户的要求去实施数据保护,采用数据加密、脱密等机制去保护客户的数据和隐私。

以云端私有化为例子,我们跟云端的算力厂商、客户三方一起构建一种安全机制——安全沙箱,整个的模型,包括客户的数据,是运行在安全沙箱中的。我们只能看到沙箱之外的数据,我们提供模型相关的状态。

对于云算力服务商来说,它只能看到算力的运行状态。而对于客户来说,他能看到提交到上面的数据以及他们所有数据的状态。这样的一个三方共建的安全技术就确保了在云端私有化环境下数据的安全性。

Q:上一个AI繁荣周期涌现的“AI四小龙”前期融资能力是比较强的,但是后期普遍遭遇了商业化的艰难探索。中国的大模型在商业化过程中,怎么避免类似的情况?

张鹏: 上一代技术是用大数据解决小问题,泛化能力不够——这些技术本身的瓶颈带来了天花板,造就的相应的业务形态、商业化落地形态,也就带有持续的问题。

“AI四小龙”的成立以及发展时间已经过去了十多年。在上一个十年中,他们所基于的AI技术我们称之为第二代人工智能技术,它存在着一些天花板——对于数据的依赖,对于任务的依赖。

大模型技术相比上一代AI技术,不再强烈地依赖数据标注,不再依赖具体的任务和场景,适用范围能力更强了。这也就意味着大模型的天花板要比之前更高。

在更高的天花板之下,公司业务活动并不聚焦在某一个具体行业,可以保持更大的发展空间、更快的发展速度。同时在商业化路径上,我们合作的伙伴是遍布各行各业,并不聚焦在某一个具体的行业。我们从一种垂直烟囱状的商业化发展路径,变成了一个真正的、我们所期待的AI平台型的发展模式。

Q:智谱AI在多模态方面的进展怎么样?有没有想要复现Sora?

张鹏:首先 Sora本身是目前多模态模型一个非常顶尖的成果。它不仅仅是一个独立的模型和产品,更值得思考的是,它背后代表的意义到底是什么。

大语言模型的飞速发展,代表着我们从语言层面上突破了认知能力的极限。在语言层面上,它已经非常接近甚至在某些方面已经超过了人。但是在现实世界,语言之下还有一些我们叫做low level的数据,比如视觉信号、声音信号、机器人控制信号等。大模型本质上解决的是打通高度抽象的知识和low level的信号。

2024年是AGI元年,多模态又是AGI的起点。如果我们要走上AGI这条路,只停留在语言这个层面是不够的,一定要以高度抽象的认知能力为核心,把视觉、听觉等一系列模态的认知能力融合在一起。

所以,对于Sora的出现,我们并不吃惊,我们也正在做。我们仍然会按照我们的步调、我们对这件事情的认知,一步步的去实现AGI。当然,多模态会是一个里程碑式的节点。

Q:Sora的出现会不会打破智谱AI原有的前进节奏?

张鹏:其实我们实现AGI有两个路径安排:第一种,看比我们领先的人在干什么。他们在做什么,我们就去研究,去学习。第二种,从我们自己理解的角度来看整个技术演进的路线。我们要有自己的创新的想法,因为只有这样我们才有可能在落后的情况下赶上他们,甚至超越他们。这两点是相辅相成的。

我们团队内部对于整体的发展规划是非常清晰的。哪怕是在Sora出现之前的2023年后半段,我们就看到了2024年是多模态和API爆发的起始之年。其实从那个时候开始,我们已经在做相应的布局了。

比如,我们在2024年1月发布的全新模型系列里面,很重要的一项就是文生图应用CogView。大家都知道,生成视频和生成二维图像之间是紧密不可分割的。那么生成更高质量的、更能够体现人的意图的图像是视频传输的第一步。这个事情上我们已经有了相应的这种数据,而且是按照相应的节奏有条不紊地持续推进。

当然Sora的发布让我们这个计划会有所加速,因为我们看到了一些新的思路、新的方法,或者是他们帮我们证明了有些方法还是可行的。我们会做一些细节上的调整去尝试加速这样一个过程,这是我们目前正在做的事情。

Q:在与不同行业合作的过程当中,智谱有没有遇到挑战,是如何去克服这些挑战的?

张鹏:挑战非常多。从我们的发展的历程中看到,我们是从高校里出来的。大家对于我们的科研能力没有什么太大的怀疑,但是商业化的能力其实是面临着一些挑战的眼光的。

因为我们对行业知识并不是太了解,所以如果要去深入行业进行合作,我们可能会做得不如预期。但今天来回顾,过去这一年我们做得还不错。我们非常清楚我们的优势、不擅长的事。我们的方式是开放、共赢,开放我们能力和行业的合作伙伴一起共建这个行业的应用,实现落地。

有一些在行业当中摸爬滚打了很多年的伙伴,积累了丰富的实践经验,非常迫切地想要引入全新的AI能力。但是他们苦于技术的高速发展,没有时间消化并让大模型的能力在行业中落地。正好我们很清楚大模型的本质以及如何去应用、诱发它的能力。双方可以互交长短,然后共同协作来磨合、落地。在刚才我们发布的十大案例中,绝大部分的落地方式是:客户或者第三方的合作伙伴来提供行业支持,我们来提供从核心技术层面赋能的解决方案。

当然,这个过程中不是客户需求什么我们就做什么。我们会说你的需求可能要稍作变化,我们大模型可以用更好的方式来提效,这也是一种共创创新的模式。我们更希望的是跟大家一起来探索新的商业化落地的方法。

Q:智谱AI在国际化方面的布局是如何做的?未来拓展国际市场的机遇和挑战是什么?拓展国际市场需要哪些国内的政策上的支持?

张鹏:国际化是一个非常重要的战略,我们已经有相应的布局,分为两个方面:一方面,很多海外企业进入中国,受到数据安全等方面的监管要求,必须跟本土大数据厂商进行合作。我们已经在接触这些客户,使大家更好地在中国实现业务的落地。

另一方面,“走出去”的一些中国企业也需要带着我们的国产大模型向海外的用户来提供服务。比如游戏出海,很多企业在服务东南亚的客户,或沿着“一带一路”向西边的国家扩展。

这需要很多法律法规及政策上的支持和配合。怎样在现有的法律法规的框架下,在安全可控的条件下,去拥抱大模型这样的新生事物,更好地实现商业化落地,需要各方协作,保持跟监管部门的沟通,保持跟各行各业企业的沟通。我们希望政府能在这方面出台更多政策,支持、鼓励中国企业充分地面向国际进行拓展。