许成钢:从研究到实践,中美角力AI差距有哪些?

《财经》记者王延春/文  

2019年03月22日 09:18  

本文3226字,约5分钟

在没有被引用的、通常是狭窄应用的研究论文方面,中国的发表总数超过美国。在深度学习、机器人流程自动化、以及包括推理学习等在内的其他领域,发表总数和引用率方面,中国与美国的差距显著。

中国风头日盛的人工智能研究与应用处于全球什么位置?经济学家、长江商学院人工智能与制度研究中心主任许成钢教授表示:“美国在基础科学领域做得远远比中国好,中国则更多的是在应用层。为了理解中国的情况,我们把美国作为前沿的基准进行对比,目的不是为了对比国力,而是通过基准对比,知道中国所处的位置。”

2019年3月20日,长江商学院首届人工智能论坛暨中国人工智能指数报告发布会在京举办。《中国人工智能指数报告》由长江商学院人工智能与制度研究中心主任许成钢教授和武汉大学大数据与云计算实验室主任崔晓晖教授团队共同研究制作。报告从学术、产业、开源软件包使用、公众认知及媒体、应用等方面,进行中美对比,以测度最近十几年中国人工智能的发展及影响。

在许成钢教授看来,以人工智能和大数据为核心的第四次产业革命已经悄然而至。过去历次产业革命中国都错过了或者仅仅部分地参与其中,这将是中国在历史上第一次从开始就参与其中的产业革命。

中国学术论文激增,但千级期刊论文引用逊于美国

从学术领域角度看,虽然美国在人工智能领域发表的论文数量整体超过中国,但是中国的增长速度较快。在学术会议参与方面,中美两国学者参加学术会议呈不断增长趋势,而美国每年都要高出中国。从人工智能各个子领域对比发现,参会人次和论文被引次数上美国均高于中国,但是在个别领域中国的增长速度在个别年份有超过美国,如虚拟代理、群体智能、机器人流程自动化等。

中国人工智能的学术文章在期刊发表方面自2006年起开始快速增长,2017年在人工智能领域发表论文的数量比1996年增加约41倍。这一趋势在2016之后尤其明显。中国的中、低等引用率的论文的发表总数,在最近几年快速接近了美国的总数。在人工智能一些领域,包括机器学习、文本分析和NLP、计算机图像与视频分析、虚拟代理及群体智能等,中国的论文发表总数和被引用总数最近几年缩小了与美国的差距。

但是,在最具原创性、最具影响力的极高引用率和高引用率的论文方面,中国与美国的差距仍然相当显著。在没有被引用的、通常是狭窄应用的研究论文方面,中国的发表总数超过了美国。在深度学习、机器人流程自动化、以及包括推理学习等在内的其他领域,从发表总数和引用率方面,与美国的差距显著。

中国发表没有被引用的论文的作者人数最近几年超过美国。但特大影响(特高引用率)作者的人数显著少于美国。

对有高等级影响力的千级论文(是指每一篇论文被引用的数字超过了1000次),中国与美国差距巨大,中国只有个别的产生大影响力的论文,而在美国则比较多一些。

为什么中国很多论文从来不被引用?许成刚认为,这个角度很有趣,有待详实的数据验证,但他估计:第一,这些论文讨论的问题是在比较狭窄范围里的应用问题,有兴趣的人少。第二,中国的激励机制所致。中国的科研体制是计算研究人员在国际期刊上发了多少篇文章,为了职称评定,学者被迫拼命发文章,却不注重文章的影响力和价值贡献。

武汉大学大数据与云计算实验室主任崔晓辉教授表示,为什么中国的学术文章引用度低?千级甚至是百级的引用,一直是中国学者远低于美国,而零级文章,也就是影响力比较小的几乎没有引用的文章却超过了美国的整体数量?“我个人分析,在中国体制内大学有一个SCI现象,即就是教授的水平高低,或者职称评定,就是看教授发了多少篇SCI文章,不管你这篇文章到底有多大的影响力。”

许成钢分析认为,在基础科学研究上,中国和发达国家的差距是历史积累的,直接跟制度有关。其中一个基本制度就是大学制度,是不是教授治校?是不是有学术思想发挥的自由环境?招募教授谁来决定?学校教授的升职谁来决定?所有这些,如果陷入一套官僚体制的评价体系,则会让大学的研究环境不够自由,不够开放,束缚了研究者的想象力。当人没有想象力的时候,基础科学的发展就面临诸多瓶颈。

AI创业公司数量少于美国

从产业领域的角度看,中国活跃的人工智能创业公司在2012年之前要多于美国,但是在2012年以后美国超过中国,且增长速度大幅度提升,而中国在2015年以后开始下降。

据了解,美国私营部门正在开足马力发展AI技术。美国与人工智能有关的企业数量远超中国。美国的投资力度似乎也很大。例如,谷歌公司、苹果公司、脸书网站、国际商用机器公司(IBM)、微软公司和亚马逊公司等总部设在美国的企业,其研发支出总计高达540亿美元,其中大部分开支进入人工智能科研领域。

最近二十几年里,中国活跃的人工智能初创公司整体上呈快速发展趋势,2016年超过400家,达到顶峰。中国活跃的人工智能初创公司数字在2012年之前多于美国,但是在2012年以后被美国超越。尤其是在2016年之后,美国的人工智能初创公司数量快速上升, 2018年超过600家,而中国则在2016年之后下降,在2018年降至不到200家。

AI人才中国是精英模式,美国则量大面广

决定一国人工智能长期竞争力的是人才要素。

《中国人工智能指数2018》分析,美国的人工智能工程师远比中国多。据领英(LinkedIn)人才数据库显示,中国的AI人才总数为5万人,而美国的AI人才总数为83万人。美国AI人才总数是中国的16.5倍之多。如果把中国人工智能领域所有的从业人员(领英里面搜集到的),按照他们已经工作多少年划分的话,可以看到,中国人工智能领域工作10年以上的不到39%,相比之下,美国超过71%的人工智能领域的人,工作了10年以上。“在中国,人工智能是更年轻的行业,而在美国虽然领域是年轻的,但是里面的多数人并不年轻,是有充分经验的。”许成刚说。

人才分布方面,中国在智能交通/自动驾驶,智能/精准营销, 硬件/GPU/智能芯片需求比例要多于美国,但美国在算法、机器学习的方面,美国不但人才的比例比中国大,人才总数也是中国的20多倍。

93%的中国研究者使用的开源软件包是美国开发

中国在最近三年里,关注人工智能开源软件包的总数迅速上升,并在2017年秋超过了美国。

但是,几乎93%的中国研究者使用的人工智能开源软件包,是美国的机构开发提供的。中美两国人工智能研究者使用最多的软件包是Google开发的TensorFlow。在2018年初,中美研究人员对此的关注人数,分别达到将近9000人和约7000人。

报告分析,整体上中、美AI研究者关注美国机构开发的开源AI软件包的数字,相当于他们关注中国机构开放的软件包数字的20几倍。这表明中国研究者在基本算法方面,对美国开源软件包的依赖。

中国对AI的公众认知正面情感高于美国

报告指出,从公共认知及媒体报道的角度看,中美两国对于人工智能的报道正面情感要高于负面情感,而中国的正面情感比例相对更高一些。

《中国人工智能指数报告》收集的媒体大数据显示,在2014年之前,中国媒体对人工智能的正面报道略多于负面,差距不大。此后,负面报道持续下降,正面报道逐年增加,全面压倒负面报道。

相比之下,全球英语世界的报道,多数属于没有正负之分的中性。在2013年到2015年之间,正负报道之间的差距曾经大幅度缩小。在2016之后,正面报道大幅度提高,而负面报道则没有显著变化。这个趋势与2016年之后美国人工智能投资初创企业的快速增长高度相关。

深度学习的应用规模,中国应是全球领先

在应用方面如果只看规模,该报告的数据显示,中国在应用方面的规模和美国已经非常接近,一些地方甚至超过。深度学习的应用方面看规模,中国应该可以是全球领先的。

但是,在人工智能的基本算法、芯片、传感器等等许多的方面,中国都落后于世界上多数的发达国家,除了美国外,还有比如,英国、德国、日本、以色列等国家。

美国的AI产业布局非常完善,基础层、技术层和应用层都有涉及,尤其是在算法、芯片和数据等产业核心领域,积累了强大的技术创新优势,各层级企业数量全面领先中国。相比较而言,中国在基础元器件、基础工艺等方面差距较大。

附图表: