大数据拉起借贷资金安全防线

文|洪佳薇  

2015年09月26日 17:47  

本文1719字,约2分钟

无论是传统金融,还是互联网金融,安全问题都是重中之重。在互联网市场下,如何利用大数据技术保障资金安全?宜信大数据创新中心旨在以技术推动金融创新,通过杰出的数据获取与分析能力,控制风险与反欺诈,确保资金安全

有人说,互联网市场之下,没有什么是大数据把控不到的。也有人说,大数据在金融风控领域的应用只是理论可行。到底是“噱头”还是革新?实践才是检验真理的唯一标准。

宜信早在2013年就成立了大数据创新中心,旨在以技术推动金融创新的尝试,如风控与反欺诈等,通过杰出的数据获取与分析能力,确保出借人的每一分钱都流向有信用、有能力还款的借款人手中。将金融这个庞大的身躯填进互联网,必须有一个强大的数据技术进行支持,那么这些数据都来自哪里?

 

四大渠道构成宜信征信数据的基本来源

首先,客户在宜信申请贷款时需要提交个人身份资料,以及个人信息的申请表,其中包含了申请人的年龄、地址、工作单位等基本信息,这些信息是宜信征信数据的基础部分。

此外,宜信也通过大数据风控搜索引擎——“姨搜”从互联网上抓取客户的一切相关信息。宜信公司大数据创新中心副总经理雷鹏介绍称,宜信总部设有12台日夜不休的大数据处理器,通过200个高匿代理IP和400个临时代理IP深入互联网的每个角落,每日截取1200万网页里约3TB的风控相关数据,如客户单位信息、常用论坛、发帖记录、消费水平、不良嗜好、地址、房价等等以作预处理的完善准备之用。

从第三方独立机构获取的数据也是重要组成部分,宜信目前已经与一些支付平台、物流公司及手机运营商等展开合作,通过第三方机构获取数据,如行业黑名单,行业经营数据,工商、法人数据,ERP,物流数据等。

除此之外,还有来自交易平台的客户授权数据。宜信公司首席战略官陈欢指出:“现在很多人在淘宝、京东上买东西,我们通过客户的授权看到他们的购买记录,大概的消费情况。通过和银行的合作,了解客户信用卡账单的情况。有了这些数据以后,基于我们对风控的理解,对不同类型客户的理解,建立风险规则判断模型,给客户进行快速风险判断。”

 

大数据驱动实时授信与反欺诈

数据库只是重要的一方面,目前宜信的商通贷产品已经完成了申请人5分钟填表,30秒授信,2分钟拿到全额款项,最高贷款额度为100万的过程,不仅能够瞬时完成,而且确保重要信息无遗漏,效率与风险兼顾。能做到这些事情,背后需要有强大的数据理解和数据分析能力。而这种能力不是凭员工的经验和公司的专业管理就能达到,需要靠整套的计算机系统驱动。

整套的计算机系统到底在我们看不见的地方做什么工作?雷鹏指出,其实就是将我们所有获取的零散的数据结构化,高效地转化为个体信用。“简单来说大数据的终极目标就像科幻电影,当有足够的运算能力,机器像人脑思维一样自动、智能地干很多今天人类完成的工作,并且效率极高,出错率极低。”

大数据技术很重要的一点就是当底层的系统建立到一定的程度,数据越积累能力就越强。系统底层的数据不仅包括了使用电商网站的年轻人的购物流水,也包括了宜信商通贷、宜人贷垂直行业的流水贷票据、物流数据。对于宜信而言,经济活动中大部分的有往来票据的都可以用智能的方式分析和处理转化为个人信用,这决定了对于有信用的人来说可以快速批贷放款。

但是从另一方面来说,对于欺诈骗贷行为的预防,也是风控的重要关口。刚刚在上面提到,宜信有一款大数据风控搜索引擎“姨搜”。它有何神奇之处?雷鹏分享了一个小诀窍,“和申请人交流时,我们可以通过‘姨搜’很快将他的基本信息找出来,根据他的申请信息定位他家的位置,找到周边信息,这时候问一下他家周围标志的银行、医院等公共场所是哪儿。如果是骗子和伪装材料,拿别人的身份证骗贷的人很难回答出来,因为他并不在这边生活。”

同时,“姨搜”还能将申请人和他资料之外的信息联系在一起,在非常快的时间内根据申请人所提供的信息关联和他有关系的或者是有过类似申请的人都是什么样的状况,了解申请人相关联的整个社会关系的好坏,这个技术叫做知识图谱。中国人讲究“近朱者赤,近墨者黑”,如果周围都是信誉好的,那么他的社会关系对于履约能力会有约束,而如果周围的人履约能力都比较差,那么他的贷款就会被拒绝。