我们执着于在长跑中胜出!
您的位置: 易方达基金 > 资讯内容     
 

 

新技术赋能反洗钱与制裁名单监控

 

字体大小:大  小  来源:[安永EY]    日期:2020-03-28  

 
 
 

名单监控面临的挑战

 

开展反洗钱与反恐怖融资名单监控是金融机构的一项重要义务,也是金融机构防范本机构的金融服务被不法分子利用的重要手段。对于拥有较多跨境业务,或境外分支机构较多的金融机构而言,制裁合规可能是自身经营面临的首要合规风险,而名单监控是制裁合规管理的基础工作。

 

金融机构根据自身客户群体、产品范围、经营地域及集团要求等,需监控的名单会有所差别。对于业务种类丰富,且服务境外客户或经营跨境业务的大中型金融机构,需要监控的名单来自或涉及公安部等我国政府或监管部门、联合国安理会、政要人物(PEPs)与国际组织高级管理人员(及其特定关系人),且从制裁合规角度还要对美国、欧盟或经营涉及的其他国家或地区的制裁名单进行监控。名单监控包括客户监控与交易监控。客户监控针对客户自身及其受益所有人,而交易监控则要涵盖交易对手及相关各方,在复杂的如涉及国际贸易融资业务的情形下,还要对地域限制、运输工具与物项性质等要素进行筛查。名单监控包括实时监测和回溯性调查,以及后续的交易报告和控制措施。很大比例的金融机构使用外部供应商提供的名单库及名单筛查系统,并与自身的内部业务系统进行集成,而部分专业能力及科技实力很强的大中型金融机构也会自建名单筛查系统。

 

名单监控有关的制裁合规一直是国际上监管处罚的重灾区,美国监管机构在2014年对法国巴黎银行开出的近90亿美元的史上最大的反洗钱/制裁合规罚单就与此有关,且刚刚过去的2019年也有多笔超过10亿美元的制裁罚单,其中不乏大家普遍认为的业内比较领先的机构。对于中资金融机构,从行政处罚数据和相关案例可以看出,“未按照规定开展名单监控”也一直是反洗钱执法检查和处罚的重点。而对于国际业务或境外布局较多的中资金融机构,美国财政部海外资产控制办公室 (OFAC) 的制裁合规风险也日益增加。近几年已有中资金融机构的境外机构由于制裁合规问题被处罚的先例,且除了罚金外,还可能出现被美国监管机构暂停美元清算甚至被直接纳入制裁名单等更严重的处罚。

 

分析以往的违规和处罚事件,包括对一些国际知名机构的处罚案例进行分析,可以发现除了管理机制方面的问题外,名单监控系统未能进行有效预警也是造成违规的主要原因。由于名单类型及名单上需要监控的对象数量众多,OFAC等名单变动频繁,不同名字及语言变种的存在以及手工录入可能产生的错误,导致客户筛查和交易筛查时出现遗漏的概率不小。而为了避免出现遗漏,名单筛查普遍采用了模糊匹配的算法,但这又导致了预警误报率高和后续人工甄别工作量巨大的问题。

 

当前金融机构普遍开展数字化转型,已将金融科技手段运用于客户营销、风险管理和内部运营等各种场景。而将新技术运用于监管合规领域,也已逐步成为国际上的热点,并形成了金融科技的一个重要分支“合规科技”。本文根据国际上领先机构的实践及安永国际、国内的相关项目经验,总结了新技术如何应用于名单监控。

 

数据驱动的名单筛查引擎测试与评估

 

未能定期对名单监控系统进行有效的评估,是名单监控预警的有效性不能达到预期效果的一个重要原因。完整的评估包括对系统实施和维护流程、系统接口、性能、信息安全、数据管理、名单管理和筛查引擎等方面的评估,而其中对名单筛查引擎的测试是比较容易疏忽的一个方面。尤其是对于依赖外部供应商的金融机构,或是默认供应商系统不会出错,或是只使用了数量不多的测试样本对系统功能进行有限的测试,从而未能发现名单管理、相关系统的接口、筛查算法等各个方面的潜在风险,导致筛查预警产生遗漏等问题。而只有基于一套全面且有代表性的名单测试样本库,对筛查引擎进行自动化的批量测试,才能有效地发现问题并及时进行纠正。



范围全面:



测试集的样本应覆盖本机构需监控的所有名单。除了通常会涵盖的联合国、OFAC、欧盟等名单,国内金融机构还要特别关注中国政府有关部门发布的恐怖组织与人员、“红通人员”、A级通缉令、严重违法失信企业(针对银行和支付机构)等名单。

 



类型齐全:



测试集中除了个人和实体的样本外,还要根据本机构的经营客群、产品、地域的情况,相应纳入船舶、飞机、物项、地理位置(国家/地区/城市/港口/地址)等方面的样本。

 



增补及时:



随着名单发布源头数据的增加和变更,测试集的样本也要及时进行相应增加和变更,从而能够实现对名单数据变动情况的有效测试。

 



语言多样:



测试集需要包含本机构经营涉及的各种语言或拼写的名单样本,可能包括英语、简体中文、繁体中文、汉语拼音、粤语拼音及其他众多的语言或拼写种类。

 



变换丰富:



除了来自名单的原始名字外,测试集还要纳入种类丰富的变换,如字母或单词的增加、移除、替换、调换、特殊字符、单词连接、单词缩写、同音、英文变换其他语言等,以及上述变换的各种组合。

 



基准合适:



对于测试集的核心样本,需要给出预计的匹配概率,用于比对实际匹配结果的有效性,且预计的匹配概率应尽量使用行业普遍认可的方式获得。

 



数量足够:



为了覆盖各种可能的测试场景,测试集的样本数量要足够多,仅仅针对制裁名单的测试样本通常就有数千个或更多。

 



变化适当:



对于每年或定期开展的测试,每次使用的测试集数据应不完全相同,需要有一定比例的改变。特别是若国际金融制裁环境出现较大的变化,测试集也应该有相应的调整。

 

 

使用技术手段将测试集的样本批量接入筛查引擎进行测试,获得每个样本的匹配分值,及与其预计匹配概率的差异,对差异超过设定范围的样本进行原因分析。另外,通过分类统计不同名单来源、对象类型、变换种类的匹配结果,可以获得筛查引擎在每一细分类别上的匹配效果。上述信息均非常有助于对筛查引擎的参数配置、阈值甚至内置算法进行优化。

 

以上是针对已经运行了一段时间的名单筛查引擎进行测试时,对名单测试样本库的要求,重点是发现应预警而未预警的问题。但若某金融机构刚设立不久,除了测试应预警而未预警的遗漏问题外,还希望分析新引入的名单筛查系统的误报率,则可以考虑使用“排除名单”(测试时不应产生预警)样本集进行测试,对由此产生误报的数量和比率、主要的情形及其原因进行分析,以其为基础优化筛查引擎的参数或阈值等配置。由于“排除名单”没有官方的来源,对其构建时应考虑名单数据来源的适当性,特别是考虑到个人信息保护的因素不宜使用不合规来源的真实数据,而是通过使用技术手段来生成模拟的数据集。

 

由于每次测试需要的样本类型和数量众多,且需要获得预计匹配概率,纯粹靠人工来制作测试集的成本高且效果不佳。安永采用互联网搜索引擎技术、机器人流程自动化(RPA)、智能文本处理、自动抽样及样本生成等技术,来高效生成所需的测试数据集。

 

二层筛查(Secondary Screening)模型

 

误报率高是名单筛查面临的一个典型问题。尤其是对于需要筛查外国及本国政要的境外或外资金融机构,该问题尤其突出。在模糊匹配算法未能取得突破的情况下,安永建议采用二层筛查(Secondary Screening)的方案,即在现有的基于模糊匹配的筛查引擎之后,增加一层基于机器学习的预警评分模型。

 

 

二层筛查模型使用历史预警的确认与排除数据作为样本,提取预警对象自身及其关系方的特征,构建和训练机器学习模型,对名单筛查引擎产生的预警进行评分,并结合产生预警的名单种类,实现对预警的分级。在经过充分测试验证的情况下,低级别的预警可由系统自动排除,从而大幅降低后续人工处理的工作量;而高级别的预警由资深的分析人员及时介入,结合系统提供的分级原因说明(归因分析),可以大幅提高预警甄别工作的效率和效果。

 

 

名单筛查的特点是最终确认“真中”的数量比较少,造成二层筛查模型训练所需的黑白样本数量不平衡,特别是黑样本绝对数量很少的情况对模型开发人员带来了技术上的挑战,且开发出的模型也需要经过更充分的测试,以及频度更高的模型验证及优化。另外,在对预警进行评分时,还要引入一些辅助性的模块,如对名字的常见性进行评估等,这些也需要专门的数据或算法来解决。

 

“风险为本”的差异化匹配策略

 

不同名单类型出现筛查遗漏可能造成的后果不同,且每种名单筛查的误报率不一样,后续需要人工甄别的预警数量也存在较大差异。目前通常对所有名单均采用完全一样的匹配策略(规则与阈值),若匹配规则或阈值较“宽松”(更容易命中),则不易产生遗漏,但会造成大量的误报;而若规则或阈值较“严格”,则误报会减少,但遗漏的风险加大,尤其是对于OFAC等名单的遗漏可能会造成不希望看到的后果。

 

前面介绍的二层筛查模型涉及到机器学习和相关算法,对模型开发、验证及优化的技能要求较高。若金融机构短期内不准备使用二层筛查模型,也可以探索使用非模型的方法,其中比较常见的是采用“风险为本”的差异化匹配策略。

 

“风险为本”首先体现在根据筛查遗漏可能造成的后果严重性对名单类型进行分级,如中国政府发布的涉恐、联合国、OFAC的名单属于高等级名单,PEPs名单的等级就没那样高,且PEPs等部分名单还有自己的子类,每个子类还可以进一步细分等级,而负面新闻的等级可以相对较低。对于高等级的名单,采取“宽松”(loose)的匹配策略,只要核心的单要素模糊匹配达到一定的阈值就产生预警;而对于低等级的名单,采取“严格”(tight)的匹配策略,模糊匹配的阈值更高,且可以采取多要素(如个人匹配时除用姓名外,还使用出生日期、国籍、地址等)综合匹配的结果来生成预警,这样产生预警的比例就会减少。由于高等级名单中的记录数量相对较少,“宽松”策略即便产生的预警比例较高,但绝对数量仍然可控。而低等级名单中的记录数量很多,“严格”策略降低了预警比例,进而相应降低预警的绝对数量。

 

对于如何设置不同名单的匹配策略,专家经验是一个重要输入,但是要决定某个具体的策略的数值时,安永建议采用情景分析方法,即使用大批量历史数据模拟计算不同阈值和不同输入要素组合的召回率和精确率,并通过ROC曲线分析等方法来确定。

 

 

提升名单筛查自动化水平的技术

 

1

机器人流程自动化(RPA

名单筛查需要覆盖全部客户与渠道,且最好是采用各种业务系统与名单筛查系统对接的形式来执行筛查。但不排除有些系统由于各种原因未能实现与名单筛查系统的连接,目前的做法通常是由人工来执行相关筛查。特别是对于数量较多且需要批量处理的筛查任务,比较耗时且容易产生差错。

 

机器人流程自动化(RPA)是一种由软件机器人来代替人工执行有明确规则的任务的一种技术。RPA机器人可以从业务系统中复制需要筛查的内容,自动录入名单筛查系统进行筛查,若产生了预警,则将其放入待甄别列表,并循环自动执行后续的筛查。整个过程除了预警甄别需要人工处理,其他步骤均由软件机器人完成,从而可以大幅提高效率、降低差错,并减少人工成本。

 

2

智能文档数字化处理

金融机构在业务经营过程中,在某些情况下仍会用到纸质文档(或打印扫描件),而部分纸质文档中的信息需要执行名单筛查。典型的例子是国际贸易融资业务文档,很多文档或单据仍然是纸质的,其中包含了需要执行名单筛查的贸易相关要素。目前行业普遍的做法是由员工阅读文档后执行手工筛查,工作量大且容易产生差错。安永建议采用智能文档数字化处理技术来对各种文档进行数字化,并分类提取关键信息后执行筛查。整个处理过程包括如下步骤:

 

  1. 通过文档预处理(包括灰度化、二值化和去噪处理等)来产生高质量的图像文件。
  2. 使用文档分类模型对图像文件进行分类。
  3. 使用对应类型文档的模型/模板检测和识别文本
  4. 使用上下文分析和实体抽取模型来进行命名实体识别,获取文本中的人名、公司名、船舶名、货物描述等关键信息。
  5. 将提取的关键信息接入名单筛查引擎进行筛查。

 

上述过程使用了OCR、自然语言处理(NLP)与机器学习等相关技术。需要注意的是,整个过程需要做好质量控制,根据准确率及置信度对识别质量进行计算,并在识别质量不满足标准的情形下,提供界面将识别出的信息与原始图像的内容进行直观的对照,方便用户对存在瑕疵的内容进行修正。整个过程由系统批量执行,大幅减少了人工处理步骤,也可相应幅度地提高效率并降低差错。

 

安永始终致力于开展监管合规科技的研究和实践,探索新技术在反洗钱与制裁合规领域的应用,帮助金融机构持续提升内部管理水平。欢迎与我们联系开展相关领域的进一步探讨。