5月10日,“2024新经济研修班”结业仪式暨“新增长模式与产业创新主题论坛”在浙江大学海宁国际校区举办。浙江大学计算机创新技术研究院副院长、人工智能研究所副所长、杭州金智塔科技创始人兼首席科学家郑小林在发言中指出,“六小龙”并非随机产生,它们是我国长期推动AI发展的结果,但AI的发展像是一场没有终点的马拉松,榜首位置会经常变化。DeepSeek推出的一个重要意义在于,它把AI从原来高高在上的状态推到了中小企业面前,让更多人可以应用这个技术,这会催生更多新的应用。他表示,在此过程中,只有做到领域增强、场景增强,才能让人工智能实现从学术到产业的真正落地。
以下为发言全文:
非常荣幸能有这个机会跟大家做一个简单的分享。最近我收到的课程邀请非常多,几乎都排不开。因为在人工智能的产业应用上,现在很火的“六小龙”把我们母校浙江大学带火了,把我们老师也带火了,我们是“被带飞”的。
“六小龙”的诞生有偶然性,但也并非随机产生,它们其实也是我国长期推动AI研究和应用的结果。国务院在2017年发布了人工智能规划,做规划的专家组组长是浙大的潘云鹤院士,他带领着十多位院士和数十位学者开展了相关规划研究。我国的布局还包括大数据智能、群体智能、跨媒体智能、人机混合智能、自主无人系统等多个方向,以及AI在制造、医疗、农业等。可以看出“六小龙”项目也与规划方向契合。
为什么人工智能现在特别火?回顾人工智能的发展,至今已经70年。1955年,AI概念首次提出。科学家们希望让机器能够像人类一样进行认知、思考和学习、以及具有搬运物体和机械操控等能力。
为了实现这些目标,必须解决大量的技术难题。历史上,不同学者和产业界人士为此付出了很多努力。
最早的阶段是计算智能,例如在金融行业里应用很多,因为金融的信息化做得最好。
第二个阶段叫感知智能,解决的是能听会说和能看会认,模拟人类的五官,模拟人类的智能。要让机器能“说”,就要学习人类的语言能力。
第三个阶段叫认知智能,让AI能够理解和思考。认知智能的发展离不开大语言模型,大语言模型是认知智能的核心。技术上它以2017年谷歌的Transformer深度学习架构为起点,对语言模型技术开展了探索。直到2022年,GPT-3发布,解决了深度学习架构的大参数、大容量的问题,模型规模达到了1750亿个参数。这样庞大的模型参数量,使得AI学习和表征知识能力得到了极大增强。这个过程中的主要技术创新以GPT、LLaMA等为主,Scaling Law是主要的模型升级优化模式,所以各大公司比拼算力、数据以及模型参数规模。
2024年12月,DeepSeek推出V3,在MOE架构(即多专家架构)、细粒度专家优化、无辅助损失策略等方面做出重大贡献,实现了训练成本的大幅度下降。
第三个阶段的两个代表,一个是OpenAI的O1模型,一个是DeepSeek的R1。这两个模型拉开了AI推理能力的序幕。
在大语言模型发展的过程中,我们必须高度肯定两拨科学家的贡献。第一是以2018年图灵奖的得主辛顿等人为代表提出的深度学习,他奠定了支撑大语言模型学习的基础;第二是今年3月获得2024图灵奖的萨顿等学者,他们提出的强化学习是推理能力的核心。
这个过程中,DeepSeek之所以出圈,归纳其原因大概包括:第一,Deepseek MOE架构优化;第二,对多态潜在注意力机制进行了改进;第三,无辅助损失负载均衡策略;第四,R1版本下的纯强化学习训练。
因此在AI的发展技术路线里,DeepSeek为大家展示了一个新方向,就是聚焦高效的模型架构和高效的强化学习,以及高效的算力利用,而不是纯粹堆算力、堆参数、堆语料。我们可以看到,原来的Scaling Law发展路径已经到了瓶颈,算力至上的传统认知被打破,这是非常重要的。
然而,DeepSeek的成功并不意味着它赢得了最终的胜利,事实上,很多公司已经开始追赶上来。比如,谷歌已经推出Gemma3的新版本,27B接近DeepSeek R1的“满血版”,而OpenAI也在4月17日发布了O3和O4的Mini版本,推理能力显著提升,通义千问也在最近发布了新版本,能力已经超越了DeepSeek的前几个版本。
这说明,AI的发展像是一场没有终点的马拉松,不是今天赢了就能一直保持领先,榜首位置会经常变化。DeepSeek的一个重要意义在于,它证明了不需要过多的参数和算力,不需要那么大量的语料,它把AI从原来高高在上的状态推到了“平民”状态,实现了AI平权。这就会催生很多新的应用,让人工智能实现从学术到产业的真正落地。
正如习近平总书记在中央政治局组织的人工智能学习中所指出的,中国要推动人工智能科技创新和产业创新深度融合。在早期美国确实走在科技创新前列,但如今中国的产业创新比较多,也越来越走到前面。以我们自己带的课题组为例,每年我们都会在全球AI顶会和顶刊发表20多篇文章。从理论研究上说,中国也确实越来越走到了前面。
人工智能的三大要素——数据、算力、模型,就像是推动AI发展的三驾马车。数据是生产原料,这也是我们国家正在推动的,国家成立了国家数据局,把数据作为生产要素。算力是生产工具,模型则是生产力。前面专家也讲到,中国一直在做模型的创新,我们有非常丰富的应用场景,模型必须跟应用、跟产业结合起来。
2024年,人工智能与众多行业的结合逐渐深入,涵盖了农业、制造业、第三产业,其中第三产业的应用最为广泛,例如营销、新零售、金融等领域。尤其是在金融行业,由于其信息化、数字化的基础较为成熟,智能化的进程相对较快。
然而,并不是任何领域或行业都能顺利将AI技术应用起来。有些地方购买了DeepSeek一体机后,发现它们的实际使用效果与预期相差较大,甚至有些单位并不知如何操作,希望能通过培训或外部支持来解决问题。这反映了当前AI技术在实际应用中还有很多挑战。
DeepSeek、chatGPT、千问等,都是通用模型,真正落到行业里面,一般要经历两个过程:一是领域增强,二是场景增强。为什么要这么做?比如,金融里面有银行、有保险,银行里面有信贷、有理财等各种不同的领域。我们跟银行合作中小企业信贷时,它的模型和跟做理财产品销售的大模型需求是完全不一样的。所以领域知识要增强,场景要增强,这样才能真正落地。
在做研究的过程中我们一直强调模型必须可信,怎样做到可信呢?
首先,行业数据可信。在各个行业里,如何协助他们建立一个可信的行业知识库?我们的技术方案是提供一个多模态数据采集提取和管理工具,对扫描的图片、文本,语音首先做切分,提取,然后通过向量数据库和图数据库来管理。基于此,我们可以给大模型做知识增强、领域微调、智能体等方面的开发,用以支撑不同的应用场景。在这个过程中,首先数据要可信,目前国家层面也正在推进可信数据空间的建设。
第二,模型可信。随着国家对AI算法公平性的监管加强,如何避免“数据杀熟”等不公平行为,也成为AI技术发展的重要议题。要让大模型真正便利好用,让产业能够尽快发展,数据必须在整个过程中是要合规的。另外,模型的鲁棒性、可解释性、抗攻击性等也都是重要议题。
在能源方面其实也有很多AI应用,生产环节、消费环节、收费环节都会涉及。今年年初,我接到比较多的需求是对上网等电力价格进行预测和智能定价。南方电网和浙大合作成立的研究院,也致力于可信数据空间的建设和上网电价的智能定价和动态预测。
接下来让我们做一个展望。
我们可以看到,随着大语言模型的发展和深入应用,已经逐渐形成了大模型操作系统的形态。我们跟系统的交互也从程序命令模式转向了自然语言为主的形式。
Sam Altman提出了AGI发展的五阶段论。在大语言模型为主的新一代AI发展阶段上,目前大家用得比较多的是智能语言对话模式,这是老百姓比较容易体验的模式,但只能解决一部分问题。第二个阶段大家更多的是解决推理能力,例如今年4月份openAI、阿里的千问3在推理能力上又有了很大进展。但真正让AI进入产业应用,今年的重点应该是智能体。我们怎么样能开发出一种智能Agent,实实在在地帮助人类解决问题?
以上提及的这些都还在我们可控的范围内, AI能够想到一些我们人类没法想到的东西,甚至能参与发明和创造。当然可能带来的潜在威胁也比较大,因为它的发明创造很可能超出我们人类的认知,是我们控制不了的。
第五个阶段,是AGI最顶级的阶段,AI演变成一个组织者,掌控所有的社会行为和分工。到那时,人类可能变成“机器”,而我们只是协助AI完成工作。
最近,图灵奖得主辛顿也在采访中提到,人工智能在过去几年进步非常快,但我们也不知道它长大后会不会“反噬”我们。他用养老虎来比喻,老虎小时候很可爱,但它长大后,也许哪天不小心触发它的原始基因,可能就会开始反噬。现在AI代码已经深入很多场景,比如电力系统,如果AI真的控制了电力系统,我们就不知道它什么时候会启动,什么时候会切断电力供应。AI发展迅猛,对人类助力巨大,但也确实存在一些安全挑战。所以我们必须发展负责任的AI,与人类友好的AI。