蚂蚁金服李振华:大数据在金融领域的应用
2018/2/28 9:46:26

在过去几年时间,快速崛起的互联网金融或者金融科技,究竟要解决什么问题?那就得看今天中国金融体系里面存在的问题是什么!

问题很多,但可简单总结为两类:

一、金融服务是难普难惠。普及面不够广,在今天中国有十几亿的人口,有七千多万的消费企业,能够获取金融服务的,占的是少数;银行体系里能向个人提供基本金融服务,除了存款之外,获得信贷、理财金融服务大概占比也不到30%。最近看到现金贷的问题,其中一个垢病的对象,就是利率太高,其实对银行体系是一样的,我们获取银行信贷服务的成本太高。

二、金融资源的分配严重不均。经济非常发达的地区,一线城市,不管是企业还是个人获取的服务都是不够的。大的企业,特别是国有企业获取的金融服务很多;小的企业、普通的个人获取的金融资源太少。

过去我们采取了很多手段,银行提出小微的融资,前面包括微型金融机构、信用社、小贷公司,思路都是要解决这些问题的,现在包括大的银行机构设立出来的普惠金融部都是要解决这个问题。

而全球金融发展到今天,问题并没有解决,美国都没有解决这个问题,因为银行机构、投行机构就是嫌贫爱富的,有钱的能够让他更有钱,没钱的不会让你有钱。没有获取金融服务,银行你要承认是商业机构,一定是商业导向的,金融服务必须具有商业可持续性,不具备可持续性的叫政策性金融机构,但是今天金融机构能回到政策性金融机构上去吗?显然不能。

阿里巴巴蚂蚁金服研究院执行院长 李振华

如何解决中国金融体系存在的问题

在技术、科技已经高度发达的今天,可以使所提供的金融服务触达层和成本得到大的改善,从几方面来说,今天数字技术发展得非常快,不管是发达地区还是贫穷地区,现在数字技术做了基本的基础设施,现在已经普及了。

举个简单例子,大家都知道,过去每一次科技革命之后都会对人类的生活、生产造成非常大的影响。

第一次工业革命典型代表是蒸汽机的发明,从发明到普及,用了约160年的时间;第二次科技革命典型发明是电力,电力的发展到全球供给用了大概60年;第三次科技革命典型的应用是计算机,发展到全球用了15年;现在是处于第四次科技革命,这是非常典型的,典型的是互联网、移动互联网、大数据和人工智能、物联网等技术爆发的周期。

每一次技术革命,看到普及程度都在快速的缩短。科技革命所导致的背后基础设施的使用成本得到极大的降低,几何集的降低,在计算机里面有一个摩尔定律,就是大概一年时间计算,在过去半个世纪以来,我们的计算能力达到多少次,大家可以算一下,基本统计已经增长1亿倍,所以技术革命,使我们使用新技术,计算、储存、传输成本几何级的下降,可以极大程度改变今天金融服务的商业模式和服务模式及成本,简单的去总结,今天越来越广的移动互联基础设施的普及,让我们金融可以有效的触达全世界任何一个地方,只要移动互联网在中国任何一个地方,西藏任何一个地方,我们知道移动和联通基本上有网络普及,拿一个手机在终端开一个基本帐户就OK了,不需要去设立网点。

大数据技术本身的普及,可以缓解过去的信息推迟,在金融服务里面,需要去做风险控制最根本的原因是在于信息不对称,不知道要不要给你贷款,你是否能够还的问题。但是大数据技术,数据的采集、储存和计算,成本大幅度的降低,数据来源如此多的风控化,有可能让我们过去在银行提供风控方式得到改变,可以用数据来做精确的用户画像,可以识别风险,根本不用抵押,极大程度上为过去没有办法分辨风险的用户给他提供基本的信贷服务,成为客户的可能。也可以使金融服务得到比较大的普及。

今天科技本身的发展,可以解决过去在金融服务里面难题,可以让金融服务更低成本去提供,还可以让普及程度大幅度提高,也可以做得更智慧、更智能,这就是科技的魅力,这是今天金融科技的本质和实质化;但如果没有这样的技术能力,不论说互联网金融、科技金融、社会金融、智能金融肯定是忽悠,一定要有这些技术在背后进行支撑。大数据对金融的应用,到底用来干什么的,大数据最大的应用可以说是风控,但是不仅仅是风控,可以有很多领域的应用,做精准营销也可以,做金融服务产品基本定价也可以。保险、理财产品,现在很多基金产品都做,量化交易全部由算法来解决,完全没有感情,完全可以替代人工经理的。

大数据的应用

谈大数据的应用,完全离不开人工智能这道坎,数据、大数据初步应用阶段,是用数据本身,取代过去的人工,取代统计的模型;大数据应用再深一层的情况下,可以通过不断的多种算法模型的优化,和新的深度学习技术和神经网络技术应用,让他初步具备智能的特征。也可以让一个机器,模拟人服务的方式、情感、语言、声音等,下一步可以让他具备人的特征,这时候就可以替代人做的服务。综合起来说,今天的数据和人工智能,都是大数据中的应用,很有可能在未来会成为金融服务基本的应用。

在这个领域里面,仅仅是做出了初步的探索,未来应用会越来越大,越来越广阔,蚂蚁在这当中做出的探索,可以分为六大类:1、信贷服务,提供基本数据模型替代传统的风控手段。2、理财服务,用精准营销和精准产品方案和智能推荐,可以应用到类似余额宝产品中,非常复杂流动性的管理上。3、安全领域。大数据去做帐户,完全基于数据的方式,去做帐户安全监控,交易追踪,以及反洗钱领域。4、征信领域。把数据方式补充过去的评分卡的信用模型,非借贷数据都可以应用到信用这个领域,极大扩大信用服务的范围和信用数据的使用。5、客户服务领域。替代人工,做更智能的回答,应用到客户服务异常监测。6、保险领域。基本的欺诈等风险的识别,也可以把过去保险传统的精算模型,加入用户特征等新的维度,用大数据的意象模型做补充,可以应用到车辆定损、通过数据源识别人的基本健康特征,识别骗保等。简单说,可以在这六类以内做探索。

大数据信贷服务的应用

大数据信贷服务的应用,大数据风控,帮助小微企业去获得贷款;从2010年开始,阿里巴巴淘宝交易上来,用户自然就提供支付之外,上面的商务快速的成长过程中,要是缺钱能不能提供基本的信贷服务,是自然的需求,开始的时候,可以跟银行借款,但是要5万、3万,银行是不愿意提供服务的,就把钱改到20万,这就违背了阿里的初衷,所以这时候就希望开发面对这些小微客户,但是又不能用传统的方式,电商能用传统的服务方式吗?传统的信贷抵押品的风控模式吗?也不行,所以唯有一条路,就是能不能探索用数据的方式进行风控,从2011年开始,成立了一个实验团队,让他们去构建,基于网络、电商交易基本行为特征,和人信用和风险之间的关系,去建立很多的数据模型。

到现在为止,这几十个模型在实践中证明是非常有效的风控方式,和非常方便的一种基于数据化的信贷方式,可以说开创了全球的网络信贷基本进程。

到今天为止,基本服务可以叫成310服务,在网上对用户的数据是多维度的数据,包括阿里、蚂蚁,以及外部的数据,做的风控模型,基本去判断,3分钟就可以判断出,要不要给你贷款,给你利率多少,1秒钟做出决策,做出决策就只要1秒钟,中间没有人干预,中间完全是机器,没有任何抵押,没有人工干预,你的贷款是时借时还,一秒钟借,一秒钟还。大家看到花呗上借的人都是一样的,我们自己也说,有没有借呗,给我提供的额度会大一点,会经常做一个周转,有时候会玩一玩,今天借一块,一小时之后还它,就是这样测试,发现极其方便,到银行提供贷款是一周之后同意。完全数据化方式,3秒钟到帐,这就是科技给人带来的便利。到目前为止,提供贷款的小额服务的商家是850万家,累积的贷款13000多亿,货币贷款、余额贷款就是3万起。

所以说,这个要怎么做?提供数据模型当然是非常复杂的,简单的说,在这个过程中,当然需要非常多的数据的支撑,基础数据要丰富,这里面包括淘宝平台加上外部的数据,足够丰富的数据联动,一般人知道淘宝上开的所有线下商家,用互联网的好处就是所有记录行为都有数据存底,这是和线下的区别,线下的交易没有做数据化,所以你不可以去进行存储,今天交易达成了你没有什么存底,这个情况下,就非常的麻烦。在线上借钱,需要建立模型来分析行为本身和风控之间的关系。这些看起来有些是无关的,大数据其实就是非结构化数据里面分析的相关性。在当中可以建立起来基本的风险控制的模型,包括算一个概率,来对他做额度的评级,基本的定价,看是不是我们的用户,预测他未来成长性,算他这个概率。还要包括什么时候给他提供基本的信贷服务等。可能要提供一套营销体系和营销模型,能够去追踪,识别用户在他最想要提供信贷的方面提供给他。

另外还要政策的分析模型,在于规则,哪些授信,给不给准入,可以提供材料,就需要通过数据模型去建立起来。我可以给他提供这种基本的营销、审批、授信到用途的监控,到最后的一套体系建立起来,到在背后完全都是基于大数据的方式建立起来基本风险甄别体系。

是这些模型基本的含义是什么,太技术化,简单说一下,在所有模型里面有一个非常核心的模型,就是违约PD模型,意思就是如何去通过我这个模型把客户过去历史贷款的信息和经营信息等所有相关人的信息全部输入到模型里面去,能够对用户的风险做进一步的区分。简单的说,把所有的数据拿到之后,去做数据资源的分类,分类之后到模型里面,每一个信息再拆解更多的变量,用机器模型在里面跑,跑的目的是什么?跑的目的是找相关性,找到对风险具有显著影响的变量,找到之后去组合一个模型,最后得出来一个PD评分。所以说PD评分越高的,就跟人的信用分数一样,越高的人信用越好、风险越小。

本文转载目的在于知识分享,版权归原作者和原刊所有。如有侵权,请及时联系我们删除。

展开全文
相关阅读
资讯查询取消