贝斯特:金融机构的“护城河”是数据分析能力

人民邮电出版社&《财经》   

2020年12月28日 12:24  

本文3689字,约5分钟

如果要在这个世界生存下去,金融机构必须理解数据分析不是一种产品,而是一种指导原则。金融机构执行数据分析的能力,对其在新世界的生存至关重要。

先来看看谷歌,目前它正在世界各地建设数据中心。谷歌每天需要处理 35 亿次的数据请求,每天产生的数据量估计可达 1EB(1EB=1 024PB,1PB=1 024TB),这样的数据量是相当惊人的。在最新的分析及金融创新(AXFI)会议上,TED 演讲人埃里克·贝娄(Eric  Berlow)被邀请谈一谈他眼中数据分析热潮背后的支撑因素。大多数人认为处理能力的提升和更复杂的算法是其背后的原因,贝娄则认为我们每天大量、多样化的访问数据才是关键。谷歌、亚马逊、脸书、微软或苹果之类的公司每天都在收集用户的数据,这意味着它们可以方便地进行数据挖掘和学习,从中发现机会。

脸书每天收集的数据大约有 500TB,其中包括 25 亿条发布、27 亿个点赞以及 3 亿张照片。截至 2012 年,脸书已经存储了大约 100PB 的照片和视频。亚马逊则借助人工智能系统基于 1.52 亿用户获取信息数据。这些公司可以从用户的评论、反馈、浏览情况和点击记录中获取信息并进行分析。

我有一个关于亚马逊的小故事。有天在开车上班的路上,作为范·海伦乐队(Van Halen)的“铁粉”,我决定收听霍华德·斯特思(Howard Stern)对大卫·李·罗斯(David Lee Roth)的采访。在我调频的时候,恰好听到了一个关于蹲便器(Squatty Potty)产品的直播发布会。这触发了我的好奇心,我一到公司,就打开计算机搜索了“Squatty Potty”,并点击了搜索结果中亚马逊的链接。我了解到 Squatty Potty 是一款帮助使用者便捷如厕的小工具,类似于放在马桶前的小脚凳。亚马逊的页面上会加载一幅图片,反映坐在马桶上并使用 Squatty Potty 的人物形象。你可能会注意到,在亚马逊上浏览过的物品经常会在其他网站以广告的方式弹出,这就是所谓的超级 Cookie。如厕男人的形象在之后的好几天里频繁出现在我面前,我不知如何让它停下来。可能有人说,这是一种有效的销售方式,但就我而言,在使用浏览器向数百人进行计算机演示的时候,弹出一个正在如厕的男人形象,场面还是相当尴尬的。

这是一个很好的切入点,我猜有人会说:“约翰,我们也一直在考虑如何处理这个问题。董事会对这样使用数据的方式有些不满,有人担心这样会侵犯他人隐私,也有人担心我们会一直监视他人。”近来媒体上爆出很多有关隐私问题的新闻报道。爱德华·斯诺登(Edward Snowden)事件,可以说是近年来最大的与隐私相关的事件,这一事件暴露了政府以保护国家为名监视美国公民的行为。无论这样做是对还是错,斯诺登向人们展示了政府可以通过人们日常生活中的手机和上网习惯,追踪它们的目标人物。

最近,另一起涉及隐私的案件是 2016 年 2 月在圣贝纳迪诺发生的恐怖袭击事件。调查人员查获了一名恐怖分子的手机,该手机恰巧是苹果手机。手机有密码保护,美国联邦调查局(FBI)无法在不丢失其内容的情况下进入手机系统。然后联邦调查局联系苹果公司,希望苹果公司开设一个特殊的后门让其获得访问手机的权限。但是,苹果以永远不破坏自己安全措施的政策拒绝了美国联邦调查局的请求。大多数金融机构在接到传票的时候,都会选择与当局合作,然而,金融机构未来采取的加密技术,可能会让自身处于与苹果在圣贝纳迪诺案中一样的境地。谷歌和脸书在全球范围内都有不少诉讼案件,其中最著名的案件之一就是零售商 Target 事件。

Target 是一家擅长使用数据分析方法的公司。我最近阅读了查尔斯·杜希格(Charles Duhigg)撰写的《习惯的力量》(The Power of Habit)一书,其中详细介绍了 Target 事件,并描述了一些关于 Target 公司数据分析部门的幕后信息。Target 发现,通过分析客户的购买习惯,可以预测他们未来的需求。例如,Target 的分析师发现了购买大量乳液、维生素的客户与怀

孕之间存在某种关联。Target 随后将这些分析结果与其婴儿登记的数据进行比较,以确定模型的准确性。以婴儿登记的数据作为指导依据,分析师建立了怀孕用户的共性购买趋势,可以帮助他们准确预测用户是否怀孕,甚至可以推测用户怀孕了多久。结果显示,孕妇群体受到零售商店的高度追捧,因为从统计角度看,无论母亲在哪里购买婴儿用品(如尿布和奶瓶),

都是因为在那里可以比较方便地一起采购其他杂货。新妈妈们最珍视时间(可能是因为睡眠原因),正因为如此,她们倾向于选择一站式购物。

Target 向一位购买了部分婴儿物品并且符合他们怀孕模型的年轻女士派发了一份含有优惠券的广告传单,内容涵盖婴儿服装、婴儿床和其他婴儿必需品。不幸的是,这位年轻的女士当时还是一名在读高中生,她的父亲对这种营销方式十分不满,并投诉 Target 鼓励他的女儿怀孕,结果却发现 Target 的模型是正确的,这位高中生的预产期在 8 月。Target 发现,单单派发特定类型商品的广告会让客户觉得他们的购物习惯受到了监控,他们还发现人们并不喜欢那种被操纵诱导购物的感觉(多亏了那位生气的父亲)。于是 Target 改变了自己的广告方式,在推销目标商品(如婴儿用品)的同时,广告上还一起显示那些无关的商品(像电视或割草机等)。通过这样的方法,Target 在不引起用户警觉,在用户没有意识到自己的购买数据已经被分析的情况下,锁定了对应的目标客户群。

Target 拥有大量与客户有关的数据,但与金融机构拥有的数据质量和数量相比,就显得微不足道了。我曾与很多金融机构的高管谈过,他们对数据挖掘、并借此进行市场推广都表现得十分谨慎,大家都担心出现类似Target 的事件。

对于金融机构的隐私问题,我的观点如下:只要是对消费者有利的,只要保证工作方式的公开透明化,你可以运用银行数据做任何你想做的事情。如果你秉持诚信为先的原则,而且是在帮助别人省钱、赚钱或是做出合适的财务决定,那么就可以做任何你想做的事情。金融机构必须抵御自身运用自有大数据操控客户的冲动。随着企业对数据应用的熟练程度越来越高,做坏事和做好事之间的界限将会越来越难以分辨。

在欧洲,人们对于隐私问题特别敏感。政府也颁布了旨在保护客户线上和数字隐私的法规,即《通用数据保护条例》(GDPR),该条例于2018 年 5 月 25 日起生效。被遗忘权和知情同意权是该法规的两大支柱。

让我们先来剖析下该法规中提及的人人都有权被遗忘的部分。在欧洲,一旦此规定实行,个人有权联系谷歌和脸书,要求它们删除自己的搜索历史记录以及公司存储的任何关于自己的资料数据。该法规还规定,跨国公司(如谷歌和脸书)将被视为单一实体。截至今年,美国的许多大型跨国公司已花费数亿美元来实现合规达标。按照规定,不合规的机构将面临高达 2 000 万欧元或公司全球收入 4%(二者取较高者)的罚款。

截至本文撰写时,Equifax 发生了一个重大的违规事件。Equifax 是一家拥有数百万账户信息和高度隐私数据的信用服务提供商。如果在 GDPR生效之后发生这种情况,Equifax 将不得不支付其全球收入(超过 30 亿美元)4%(约 1.2 亿美元)的罚款。请牢记,如果你收集的数据涵盖欧盟国家公民的数据,那么理论上 GDPR 就对你适用。

知情同意权意味着我们不能再使用 50 页的 EULA(最终用户许可协议)外加一个“我同意我已阅读并理解 EULA”按钮选择框的方式了。GDPR规定,机构必须明确地向客户传达需要他们确认的内容。许多人在互联网上发现了自己的数据后才意识到他们之前安装的某款软件的 EULA 中包含一项允许该公司挖掘其个人数据的规定。一家名为 PC Pit Stop 的公司决定测试下是否有人认真阅读 EULA,于是在 EULA 中增加了一项条款:只要用户发送指定内容到指定的电子邮箱,就能获得一定的报酬奖励。直到第四个月,才有人认真阅读了 EULA 的内容,并发送了一封电子邮件(此人获得了 1 000 美元),这个例子说明几乎很少有人真正阅读 EULA。知情同意权为用户提供了保护,禁止机构利用冗长的条例文档麻痹用户的举动(机构知道没人有时间去仔细阅读)。知情同意权还明确规定,EULA 不应包含与其软件或数据处理无关的要求;如果有这些需要,则必须明确地向最终用户说明,让其可以清楚地意识到该请求超出了此 EULA 的特定范围。这意味着 EULA 中不应存在任何漏洞。例如,允许公司向第三方出售用户与其服务的交互数据,特别是在该第三方的服务与此前的产品和服务没有明确关系的情况下。

好消息是,金融机构拥有海量的数据、合适的人才以及良好的意图,而且对于我们大多数人来说,GDPR 等法规并不会带来什么影响。我们可以代表服务对象使用相关数据获得分析结果—事实上,大多数客户都期待着这种服务。

(本文节选自《数字化金融》人民邮电出版社)