中信建投武超则:ChatGPT背后有两大核心技术支撑,AIGC热度会持续|元观点

作者 | 康路  

2023年02月10日 10:35  

本文4303字,约6分钟

投资者的机会在于关注三类公司。

日前,ChatGPT实现注册用户数破亿,用两个月走完了Tik Tok9个月、Instagram(Meta公司旗下社交产品)两年半走过的路。其引发的AIGC话题不断被热议,也自然掀起了资本市场的热浪。

“如果说终端像人的眼睛和耳朵,让人们拥有更多的数据和信息,那么AI就是人的大脑,要处理指数级爆发的海量信息,同时筛选出哪些是有效信息,哪些是无效信息。”中信建投证券研究所所长、新财富白金分析师武超则表示。

事实上,AI已不是第一次“出圈”,上一次是AlphaGo战胜围棋世界冠军之时。而此次OpenAI推出的ChatGPT受到的关注已远超AlphaGo,原因何在?“其实这次是大模型的迭代加上基于人类反馈的强化学习、算法的优化,最终看到生成式AI真正的模型跃升。AlphaGo是‘决策式AI’,即在清晰的规则基础上,让AI替代人做选择。最近非常火热的ChatGPT是AI的另外一条路径--‘生成式AI’。”武超则表示,而且这次“它开始引入基于人类反馈的加强模式,”因此变得更聪明、更有逻辑。“这背后是底层模型算法创新和训练机制创新两大技术支撑。”这也带来了AIGC技术的拐点。

在此基础上,投资者的机会在于“关注三类公司,即算力类、模型类和应用类。涉及到细分方向上,不管是做应用、算法,还是做AI算力服务的相关企业,最近表现都很好。”武超则表示。在科技领域的投资有一个大家都比较熟悉的周期性规律,即“三年硬、三年软、三年模式再创新”。目前,始于2018年前后对于芯片等硬件投资的热潮渐渐退去。从2022年起,科技领域的投资重点或将逐步回到商业模式和软件创新,“而AI是非常典型的偏软件和应用创新的产品,当然也会进一步带动算力基础设施的需求,所以我认为AIGC的热度会持续下去。”武超则说。

(以下根据实录编辑整理)

Q:您如何看待最近火爆的ChatGPT现象?

武超则:AI技术最近非常火热,我以前提到一个比喻——如果说终端是传感器,像人的眼睛和耳朵,让人们拥有更多的数据和信息,那么云和算力其实更像骨骼和肌肉,支撑了底层的动能和动力,就像数字化时代的“水电站”。

而网络就像我们的神经中枢,要接收并传递我们来自眼睛和耳朵看到的所有数据信息东西,并把这些数据传递进来;AI则是人的大脑,要处理指数级爆发的海量信息,同时筛选出哪些是有效信息,哪些是无效信息。

这次OpenAI推出的ChatGPT,背后可以看到其真正的模型跃升。大家之所以感觉输出的机器人不那么“傻”了,开始变得聪明,核心原因是其基于GPT3的大模型在过去几年的迭代后训练的数据集从亿级到了千亿级,同时基于人类强化的训练机制使得算法得到了优化。AI的学习不再是一种漫无目的、海量的学习--这种学习模式不仅算力很难跟上,甚至会造成浪费。

有人担心AI技术的大幅跃升会颠覆分析师职业,实际上我认为那一天还比较遥远,分析师有三个阶段:输出知识和信息、输出经验和专业、输出逻辑和定价,现在AI还主要是在第一阶段,在辨别信息真伪方面也有待提升。但AI会提供非常好的工具,使得人们从之前完全由人决策的模式走向未来人机结合的决策模式,也会在替代低效、重复类工作上效果显著。

比如文档校验,或者当创作没有灵感时,可以通过AI带来思路。再比如金融行业,AI可能无法替代分析师做深度的研究,但在时效性要求比较高的季报期、年报期,人往往容易出错,机器反而会做得更好。

Q:ChapGPT的AI技术表现如此亮眼,其背后的核心要素是什么?

武超则:首先,从技术上来讲,AI这次到底跟以前有何不同?上一次AI“出圈”是战胜了围棋世界冠军,引起了业界很大震动。实际上当年的AI只是决策模式,但成为非常成功的AI范式。

“决策式AI”就是在清晰的规则基础上,让AI替代人做选择。事实上,AI在很多应用场景里做得非常好,最典型的如短视频行业大量头部公司,其成功之处并不仅限于创作了很多好内容,而是在内容分发环节做到了千人千面,改变了人们获取信息的方式——从过去用户主动搜索,变为系统主动推送。相当于人们获得了一个超级搜索引擎,这也成为“决策式AI”时代非常成功的商业模式。

在此模式下,诞生了万亿市值的公司,也颠覆了很多行业。比如自动驾驶领域的发展就是“决策式AI”时代,机器比人强的体现——基于清晰的驾驶规则,在停车、调头等基本控制上,AI实际上比人做得更好。

最近非常火热的ChatGPT,其实就是AI的另外一条路径,即AIGC——通过海量的、有目标的学习,生成全新的内容。AIGC并不是一个新概念,翻译成中文是“AI生成内容”,也就是说,AI不仅能做选择题,也能做解答题,可以解答或者创作新内容。这是和以前的AI有本质不同,也是最近市场对ChatGPT关注度甚至比去年的元宇宙概念都高的原因,同时可以看到微软、谷歌以及百度等巨头公司都宣布已大幅布局AI。

事实上,“AI生成内容”过去不是没有,只是核心问题一直没有得到解决。比如算力问题,面对海量数据集,以前的AI只是漫无目的的学习,往往效果不佳,人们和AI机器人对话,会觉得它像3岁小孩。而现在AI输出的机器人变成了12岁小孩,其智商和语言组织能力、逻辑能力都大幅提升。

这背后有两个重要的技术支撑,其一是底层算法有创新。2017年Transformer模型的诞生是一个非常重要的里程碑,后续的GPT-1.GPT-2.GPT-3参数从亿级到千亿级,参数量显著提升,智能水平不断提升,在此基础上,chatGPT才能很惊艳。当然大模型的迭代需要算力、算法和数据的全面提升。比如模态转换,过去的AI还无法实现图片与声音、视频与文字之间的转化,现在AI可以通过模态间的互相学习,将声音直接转化为文字,文字也能直接生成图片,使得数据集的数量级和模型训练的效率都大幅提升。

其二是训练机制有创新。在transformer大模型基础上,引入基于人类反馈的强化学习,对话才更贴近人类的思维。Open AI引入40人左右的一个团队,对AI的算法模型进行了人工标记,使得模型的学习不再像小孩子一样无论“好”、“坏”漫无目的,而是基于人们想培养什么样的“人才”,让其去学对应的专业课,并选择哪些课重点多学,哪些课不学。如此,AI算法对数据集的学习效率大幅提升,能够匹配目前的算力水平,极大提升了训练效果。

虽然AI升级的背后还有其他技术支撑,但我们认为大模型迭代和训练机制是其中最重要的两项,也带来了“AI生成内容”的拐点。此时要回答第二个问题,即“AI生成内容”到底在应用上给各行各业带来什么变化?

此次ChatGPT在技术上的革新,不仅推动了未来AI应用的开发,还加速了各行各业的数字化。比如,在编程这一劳动力密集型行业,ChatGPT之所以短短几天内就注册了100万用户,就是因为其在编程上有了很大突破——只需要输入指令,就能够实现自主编程。

游戏业其实是工业化比较成熟的行业,所以相较于灵感和创意,反而在如生产效率、内容输出连贯性等工业化流程方面有更高要求,因此“AI生成内容”在这一领域能发挥重大作用。

长远来看,AIGC不像元宇宙能细分各种赛道,而是跟各行各业都发生关系,甚至重塑行业。比如Office、WPS这类成熟的软件如果有高质量AIGC工具,产品形态很有可能被重新定义,办公软件行业也因此被重塑,再如生物医药行业可以利用AIGC更快地发现新生物或分子结构。

Q:未来三五年,AIGC有哪些可以布局的投资机会?

武超则:AIGC行业包含两类公司,一类是模型类,或者称为平台类公司,它能提供类似安卓系统的底层操作系统,或者底层工具。典型案例是Open AI,其对应的标的企业如微软、谷歌、Meta(Facebook),包括国内的百度、阿里、字节跳动等,布局AIGC的目标都是做底层工具。

另一类是应用型公司,其目标不在于操作系统或底层AI模型,而是制作可以直接拿来使用的应用。目前很多国内外大公司都会开放大模型,其他公司可以拿他们的模型训练自己的小模型及开发应用;国内前两年也产生过比较好用的场景,训练AI在垂直方向的应用,比如教育行业的教育机器人,医疗行业的智能客服等。

应用类公司的核心壁垒是场景和数据源,因为AI的本质就像一个嗷嗷待哺的小孩,需要用数据来喂养它,如此AI模型才会越来越强大。企业如果没有一手的数据,或者足够大的数据资产和场景,很难有先发优势。

短期来看,中间层模型或者应用类AI公司在国内落地可能性更大;但长期来看,中国也有可能诞生大模型或平台类AI巨头公司,因为此次Open AI的技术创新并不是颠覆式的,其本质是模型上的优化,别的竞争对手能够很快跟上。在数据安全和底层资产保护要求越来越高的大环境下,中国也很可能产生AI的大模型、平台类AI公司,但这是一个长期的过程。而在短期内,谁能将模型用得好,就可能在原来的商业模式下领先竞争对手。

在投资机会上,AIGC行业目前还属于赛道或者说是主题投资。涉及到细分方向上,不管是做应用、算法,还是做AI算力服务的相关企业,最近表现都很好,未来随着时间的推移应该会慢慢分化。

在2018年前后,大家还比较排斥甚至不太关心模式和应用创新,而期待芯片等硬件创新。2022年以后,整个科技领域的投资重点逐步从硬件又回到商业模式和软件创新。事实上,科技行业的发展有周期性规律,即“三年硬、三年软、三年模式再创新”。现在,“三年硬”已经过去了,“三年软”和“三年模式再创新”将会是接下来比较重要的方向,这是由技术规律决定的。当然硬件和软件服务现在的边界越来越模糊,而且应用和软件的创新也会进一步拉动硬件和底层算力的需求。

文|康路  王悦

编辑|康路