李扬:大数据之所以大就要共享,就要有云计算配合

2018年04月09日 09:35  

本文3590字,约5分钟

“大数据是公共品,必须向公众开放。公共开放了,大家都对这个数据进行了使用,然后从中根据自己的专业特长,发掘出来对于社会宏观经济有价值的信息,甚至进行信息再加工,这样我们整个管理水平才能提高。” 4月9日,中国社会科学院国家金融与发展实验室理事长李扬在参加博鳌亚洲论坛“《财经》早餐会:大数据风控与征信体系建设”上表示。

中国社会科学院国家金融与发展实验室理事长李扬

李扬认为,中国数据是优势,但是数据被分割了,数据必须足够才能有用,而中国的情况是加总起来的数据是大的,但是每个机构可以用的数据其实是小的。当数据被分割不可能取得全部数据的时候,大数据是违数据。

同时,他强调大数据是公共品,必须向公众开放。公司搞自己的信用评级实则是一个私人产品公共化的过程,私人产品公共化必须接受公共管理的规则,公共管理规则自然有公共管理的架构。

以下为李扬发言实录:

李扬:今天讨论这个问题,我只知道一些皮毛,而且发展的非常快,给大家谈一点观察。先说一个事,应当是前年,我们蚂蚁金服给我一个交易实时的图,然后告诉我他们建立了一个信用评级叫蚂蚁信用,他们找我去是想挖掘一点政策资源,他想把蚂蚁评级变成一个公司,面向公众评级产品。

但是人民银行不批它,他提出来第一条可以做,每个公司实际上都不同程度地在搞自己的信用评级,大一点的公司都有自己的评级模式,更多的依赖自己的评级结果来做投资决定、贷款决定。你把自己的评级公众化,你就必须把自己的评级体系、评级结果还有母公司切割开,你以后叫一个什么什么信用公司,不能叫阿里巴巴不能叫蚂蚁金服,他舍不得,觉得这个东西很挣钱,前景很广阔,他确实做得不错,尤其在浙江杭州基本上覆盖了,这是一个问题。

第二,人民银行有关的部门做了一下检测,有很多高等级的消费者,有的是法人消费者,结果跟人民银行的评级的结果对照一下,发现不一样,就是这个里面有皮扯了,理论上来说,他的体系里面是高等级,人民银行体系里面也应该是高等级,因为你获得的信息像金融的信息,特别是这种在传统金融的领域上面的信息应该说主要的信息至少占的权重很大,但是差别很大。

这其实跟今天话题有关了,信用评级是什么人都可以做的,产品推向社会就是一个公共产品必须服从公共产品的管理规则,我觉得看到很多搞技术的,都是受过良好的训练,心比天高,你要认这个账,你生产的是私人产品,私人产品公共化必须接受公共管理的规则,公共管理规则自然有公共管理的架构,比如说你得向当局报告,我不管你要让我知道,这个体现了私人生产产品公共使用的一个管理架构,这个架构我们必须牢记,而且在中国必须有这个。

这个基于信息的差别,他们没有说什么缘故,有可能这个公司蚂蚁金服覆盖的活动很少,搞贷款大公司比较多,那个方面有所疏漏,那边评级等级不高这样的一个结果当然技术上面可以加以弥补的,我想说的一件事现在各路英雄起四方谁都可以做。

李扬:就像银行以前依赖那样几个表,所谓结构化的一些信息,前证监会主席刘明康一个著名的银监会主席,他说要看水表、电表,当时提到了这个问题,对于小微企业哪有子负债表还有损益表根本没有,而且对他来说如果引进公共的一些机构来给他做的成本负担不了。

但是,每天的运营水表、电表、构成了对于信用等级评判的最基础的数据,有些地方做这个应当说还不错,与这个类似的,因为我参加很多这种活动,上个世纪末本世纪初参加关于风险投资的体系建设,那个时候还在金融所做所长。

全国也是风起云涌搞了这个孵化器,有些地方孵化器做的不错,比如说成都武汉孵化很多公司,他盖楼有一个物业吸引各种各样的企业来在里面挑,都是我说你们怎么样挑投资,他说一个电话,你电话的多少这个可以记录下来的。

第二,访问的人,因为来的人谈了生意,都要进行登记他就进来多的就投资,现在这里很复杂了,但是这个是一个道理,现在我们用了很多非结构化的数据,然后通过算法的提高算力的提高等等,搞出来眼花缭乱的东西,但是道理还是这个道理。

原先结构化的数据确实是不能准确的反应全面的情况,有些情况接触不出来,但是这样的一些非结构化数据加进来现在一些算法接触出来,这个后面的信用等级当然是提高,道理还是同样的道理。

大数据之所以大就要共享,就要有云计算配合。

黄振华:我们跟国家监管机构是双向的共享,传进去监管系统,监管系统匹配,匹配出来这个用户有问题他会发给你一个代码,都是加密的。

李扬:这个就是所谓的一个数据整合问题,大家都说数据优势、技术优势两大优势,中国数据是优势,但是数据被分割了,你拿的数据不跟别人公司。数据必须够才能有用,而中国可能你加总起来的数据是大的,但是每个机构可以用的数据其实是小的,金融机构现在只有太平平安,平安的数据算不错的,他是自己的,他又是保险又是证券银行,他这个背后有一个大的数据,我们现在有的时候做事用平安的数据,这个大公司做的比较可靠,而且没有那么多的潜能的东西,像跟你不知道怎么样合作,我觉得你的数据肯定小了。

主持人:他是一对一的数据。

李扬:宏观分析这个事情很大了,这个事情没有引起当局的高度关注,人民银行的支付清算我们坚持做了十几年,人民银行几任的司长还有分管行长每次换人跟他们游说这个重要,到现在他们还不认为重要,数据也不愿意提供,我们只好根据社会的数据进行回溯过去,数据非常有意思。另外数据清算的集中度开始分散,头两年分散这两年又集中了。

而且数据观察看到上海作为金融中心地位在削弱,怎么样进去怎么样出来这个才是中心,这个其实可以看到很多这样的,所以我们在强调大数据是公共品的同时,也强调一下向公共开放,这个公共开放了,大家都对这个数据进行了使用,然后从中根据自己的专业特长,从中发掘出来对于社会宏观经济,甚至社会有价值的这些信息,甚至在信息再加工,这样的话我们整个管理水平才能提高,因为我想从我们做宏观的这个角度来说,总之是要提高你的治理体系,促进治理体系和治理能力现代化,充分将这个数据用好,所以国家我觉得必须强制的要让这个数据能够贡献。

而且掌握的数据不影响公众开放。我不知道你记得不记得,上个世纪九十年代朱镕基委托的去韩国看征信系统,看课税登记系统,美国一个号后面就是金融信息纳税信息全部在里面,这个时候都说跟我谈这个事情技术上面没有什么问题,中国这个集中统一的国家,制度上也不应该有问题,但是就是有问题,各个部门掌握的数据互相不分享,你要他得要钱,有的时候钱还买不到,所以就是这个我觉得我们形成一个结果的话,是要防控风险改变要公开数据,打破这个数据的垄断,我想说的就是这个意思,这个是一个基于数据来做信用的评价等等,这是一个公共事务,应当遵循公共经济学的基本逻辑。

主持人:多谢院长,刚才黄总讲这个你们公司跟征信风控之间的关系,我感觉有一点多对一的感觉。你想拿一点住的信息或者电表的信息,银行个人的交易数据等等,他不是一个大数据,大数据巨大无比的数据分析一个什么事情,尤其风控体系,你讲的不是一个直接跟大数据的关系。

李扬:大数据在于实施了,基本是大数据的领域内了,传统的统计学没有用了,传统统计学产生发展是因为得不到整体数据,所以用局部推断整体,各种模型这个分布那个分布的,大数据来说全部可以拿到了,所以我就想再强调一点,就是当你数据分割不可能取得全部数据的时候,大数据是违数据。

李扬:按说法律上面来说人民银行获得的信息必须借钱,你要银行借钱进入的信息,我们存款者也把他搞进去,这个世界各国都是这样的,你要借钱成为银行的债务人你们就进来,但是你银行债权人,像我这种根本不从银行借钱,我只在银行存钱理应没有我但是还有。

主持人:就是把你的信息弄到了征信信息系统了,等于你的隐私侵犯了。

李扬:90年代到美国刷信用卡,我说申请信用卡账上八千美金,我说为什么不给我信用卡,他说你没有信用记录,这个信用记录是西海岸的什么公司评定的,不断的买不断的退不断的信用记录,有交易记录才有信用记录然后才有一个信用卡,这个例子说蚂蚁金服还有人民银行信息差距的问题,他覆盖存钱那个地方,我有这么多的钱我的信用可以得到保证的。

李扬:大家都是说依托信息的,每个获得信息的选择不一样的,要想完整的获得,对于信用评级必须尽可能的广泛,我主要想说这个意思,我有钱他不给我,你这个什么没有他给你,这个依托的就是选择信息的时候有所选择,这个应当说每个都有偏颇,现在既然有大数据了,有算法算力飞速的提高必须广覆盖,尽可能多的,不至于产生人民银行的信息巨大的差异,这两个数据拿出来你信谁,蚂蚁金服是另外一套的,人民银行是这样一套的,两个都是,它怎么样获得一个完整的刻画。

李扬:最近大学生贷款坏账率非常高,重点大学违约率,师范学院现在还有非师范生,这个职业有关,以后职业基本上分配,人都是很恶的,做征信就是里面甄别出来好人来,好人不要受恶人的影响,这个数据拿出来很可怕。