大数据技术在反洗钱领域的应用探析
2020/1/18 16:55:01

本文选自《金融电子化》2019年11月刊

作者:中国人民银行营业管理部 刘丽洪、中信银行北京分行 朱彤

我们生活在数据时代,数据根植于生活中的每一个角落,各行各业都试图利用大数据的理念,大数据挖掘技术,大数据信息处理解决方案,创造价值,提高效率,而金融机构反洗钱工作也不例外。

反洗钱可疑交易监测分析需要从海量数据中甄选出有效数据,通过定性和定量的分析,深入挖掘客户的多层次、多元化信息,确定客户洗钱可疑交易行为。如何利用好自身和外部数据信息,提高反洗钱工作的有效性和精准度,成为金融机构新的挑战和机遇。

当前工作存在的局限性

业内普遍采取“模型筛查+名单监控+人工甄别”的可疑交易分析报告监测模式。因这种模式尚未引入大数据和人工智能概念,在数据使用和模型更新方面,主要呈现以下四方面的局限性:

1.数据处理时效性差。当前的数据处理通常分为数据扫描和加工处理两个环节。以树形结构作业模式为例,通常需要100多个小时才能完成1P的数据扫描。同时,单机处理模式从海量数据构成的样本群体中识别出与该群体有显著差异或者异常情况的离群样本耗时较长,无法及时发现可疑交易,阻断各类犯罪资金链条,减少并追回损失。

2.数据信息整合分析困难。可疑交易监测模型的准确与否,依赖于客户在金融机构留存的基础信息是否全面、完整,以及资金链条是否可追溯。当前各家金融机构普遍存在底层数据缺失,数据格式不统一,留存在各业务条线的信息整合不力的问题。再加上客户基础信息真实性审核渠道有限,客户跨行交易和与第三方支付平台交易都容易造成的资金交易链断裂,给可疑交易人工甄别工作带来一定的困难。

3.可疑交易监测模型更新滞后。传统的可疑交易监测模型,需要指明特定场景,明确具体字段,并将数据匹配整合到可疑交易监测模型,而严格的阈值也直接导致了可疑交易的误报和漏报。同时,犯罪分子的洗钱手法也会随着反洗钱措施的加强进行演化,导致对新型洗钱犯罪模式的监测滞后,造成可疑交易的识别率低,误报、漏报率高等情况,需要耗费大量的时间进行人工筛选和判断。

4.单一可疑交易监测标准精准度差。目前业内大部分机构的可疑交易监测模型仍是以单一监测标准为主,也有部分机构尝试通过多条监测指标,以“打分卡”方式监测可疑交易,但终因数据标签抓取不理想而无法实现精准定位可疑交易的目的。金融机构缺乏以洗钱罪上游犯罪衍生的资金特征进行可疑交易监测的理念和实际应用,这些都导致了金融机构对监测数据利用率有限,对监测分析人员的依赖程度普遍较高的问题。

大数据技术可带来的优势

大数据将积累并引入多渠道的海量客户信息,一旦账户交易情形与可疑交易监测模型匹配,依靠大数据建立起来的智能可疑交易监测系统会自动预警,而人工智能技术将根据客户以往轨迹分析其行为特征,从客户交易行为中找出异常交易,发现背后隐藏的违法犯罪行为,能够很好弥补“模型筛查+名单监控+人工甄别”监测模式的局限性,这将急速提高金融机构反洗钱工作的有效性。

1.数据分析能力的飞速提高。随着数据量处理量的爆发式增长,集中式存储的传统数据库将由基于关系型的分布式数据库替代。CRISP-DM分布式服务器实现联机实时扫描,数据处理过程相当于一台机器发布指令到多台机器里去执行,然后汇总数据。近1P的金融交易数据的单次扫描时间约在50分钟,且完全兼容客户现有业务逻辑,全量数据扫描时间实现从“天”到“分钟”的数量级跨越。

2.多元化数据源的有效整合。根据金融行动特别工作组2017年11月发布的《私营部门信息共享指引》(Guidance for Private Sector Information Sharing)建议,公共部门和私营机构在保密可控的前提下,将打破信息孤岛,实现信息的共享。金融机构可考虑利用API技术,打破内外部信息壁垒,串联多方系统,或向第三方借力去调取数据,综合分析客户异常交易行为。这些数据来源不同、差异性大且互相印证,可将客户身份全息图景画像越描越细,分析结果更加真实并具有前瞻性。

3.数据分析平台的优化。当前大额和可疑交易监测系统将转型为统一集中数据分析云平台。数据分析云平台可以整合客户有关内外部海量数据,对客户异常交易信息进行有效地深入分析和处理。相比人的判断和人力资本,这种技术变得更加可靠、更加高速、性价比更高。那些与反洗钱合规管理相关的数据将通过人性化的、一看就懂的“仪表盘”的方式予以展示,实现人机良好对话模式。

4.数据监测的智能化。数据分析云平台势必将引入人工智能技术,人工智能将大大缩短监测模型更新滞后的局限性,对新型犯罪模式下的异常交易行为进行自我归纳总结,在系统中实施异常行为预警等工作,帮助人工及时定义新型洗钱类罪。同时,人工智能还将完成最终受益所有人的识别、账户补录等日常反洗钱数据采集和识别工作。

相关建议

大数据和人工智能技术的引入将使得金融机构更加快速、准确、简单地发现可疑交易,阻断非法资金流动,更加精准地管控洗钱风险,金融机构应从以下五个方面着手。

1.做好底层数据治理工作。大数据的根本是数据的完整性、真实性和可利用性,金融机构应对标监管要求,将前、中、后台数据资源有效整合,积极开展底层数据治理工作。一是参考监管“300号”文件中有关反洗钱现场检查数据格式标准要求,统一规范系统数据的字段、格式、内容、数值标准,确保系统平台能准确理解接口数据提取范围、格式要求、数据表字段含义等内容;二是应重新审视自身数据仓库、核心业务系统、渠道系统、产品系统之间的数据匹配和映射关系,积极改造业务流程和业务系统,确保系统之间推送数据的准确性和完整性;三是应精细梳理各金融产品、业务,精准确定并打好可疑交易监测分析依赖的关键数据标签;四是持续加强客户信息质量治理;五是加强数据兼容治理工作,加强本单位不同业务系统间数据的可利用性。

2.加强多渠道数据的融合。基于大数据的反洗钱工作,除了使用金融机构、第三方支付平台之间资金流动数据外,还可以考虑组合使用来自工商、税务、房管、海关、贸易、交通、质检、劳动人事、公安、法院等政府部门,以及消费、娱乐、社交等商业活动及生活领域多个源头的数据。如通过工商、税务、司法等部门公开的信息,可查询对公客户是否存在证照过期、偷税、漏税、违法犯罪等不良记录。通过互联网也可以查询到部分机构客户和自然人客户的信息。通过这些途径,扩大了客户信息的来源,通过客户信息资料比对,可以使可疑交易的识别更加精准高效。

3.建立一体化的反洗钱数据管理机制。为了避免数据在获取、传输和共享阶段可能发生的失真和泄密情况,金融机构应积极制定网络安全标准,落实网络安全责任制,加强网络安全事件应急能力,建立一体化的反洗钱数据管理机制。一是保障真实性。在数据传输、存储和加工过程中增加校验环节,防止文件数量、文件字段发生缺失,避免字段信息的基本逻辑发生错误,而直接影响数据分析质量;二是保障及时性。加强数据修改联动提示功能,一旦前端业务系统修改字段信息,应及时通知后端数据仓库启动复核和修改机制;三是保障安全性。在实现风险信息共享机制的情况下,对数据查阅、调取和使用等关键环节,进行分层、分级管理,合理分配数据使用权限。

4.提升可疑交易模型监测精准度。大数据技术的战略意义不仅在于掌握庞大的数据信息,而更重在于将这些含有价值的数据进行专业化的处理。可疑交易监测模型应随着大数据技术的引入,有效打通各数据子集之间的关联应用环节,丰富可疑交易监测字段范围,从“知识图谱”的角度,围绕客户主体、财产状况以及社会关系等因素,对客户信息和交易行为的真实性、合理性开展研判分析。同时,对模型监测字段加以分层、分类管理,将对类罪有直接指向性的字段予以重点关注,可以大幅提升可疑交易模型监测精准度。

5.积极发挥人的作用。在“以合理理由怀疑”的可疑交易分析基础上,人工甄别的作用仍然无法取代。大数据将成为可疑交易人工甄别的重要辅助手段和有效工具,更有效地服务于金融机构反洗钱工作。金融机构应更加深入思考反洗钱从业人员在新模式下的反洗钱风险管理体系中能够发挥的作用。一方面,增加具有信息科技背景的人力资源的投入,同时加强对现有反洗钱从业人员的科技培训,促使反洗钱从业人员获取以计算机和数据为导向的新技能;另一方面,金融机构应积极建立反洗钱和业务融合式工作模式,搭建反洗钱从业人员和业务部门人员一起研发重点项目和产品机制。以项目驱动的方式,反洗钱从业人员与业务人员一同工作,一起接触市场和客户,共同制定产品方案、制定营销(投标)方案,促进反洗钱理念在业务与技术之间全流程无缝对接。

本文转载目的在于知识分享,版权归原作者和原刊所有。如有侵权,请及时联系我们删除。

展开全文
相关阅读
资讯查询取消