蚂蚁集团联合清华大学发布《金融大数据反诈技术白皮书》-移动支付网

蚂蚁集团联合清华大学发布《金融大数据反诈技术白皮书》

2023-1-10 11:03来源：移动支付网

2022年12月1日，《中华人民共和国反电信网络诈骗法》正式发布生效，该法明确了对电信治理、金融治理、互联网治理三个领域的治理要求。在此背景下，蚂蚁集团联合清华大学发布《金融大数据反诈技术白皮书》（以下简称"白皮书"），结合当前的反诈技术理论与业界实践，对金融风控场景下反诈系统的基础设施建设以及风险全链路反诈核心技术展开阐述。在这里我们针对白皮书做一个简介导读。

张尧学（中国工程院院士、清华大学人工智能研究院院长）：

习近平总书记指出“要构建以数据为关键要素的数字经济。建设现代化经济体系离不开大数据发展和应用。”而数据安全治理和反诈是数据经济的关键支撑技术，准确的欺诈识别和高效的决策处理可以极大提升数字经济系统的运行效率。蚂蚁集团在数据安全治理和反诈技术领域处于业界领导地位，风险识别准确率和资损率等指标国际领先。蚂蚁集团和清华大学在该领域有长期合作，取得了丰富的成果。

我很高兴看到蚂蚁集团和清华大学愿意向业界分享金融大数据全生命周期的反诈技术框架。该框架以多维异构超大规模交互图和可信人工智能算法为基本的检测能力基础设施，实现了事前风险感知和预测、事中攻击检测与防护、及事后威胁反制及追责为闭环的反诈检测和打击能力。我相信该技术的广泛应用能够对我国数字经济的健康发展特别是互联网商业反诈产生积极的影响，我也期待蚂蚁集团和清华大学未来进一步携手合作，为数字经济生态建设做出更大的贡献。

倪行军（蚂蚁集团首席技术官）：

在数字化转型的大背景下，我们一直在探索用技术构筑数字时代的安全屏障，用科技助力反电信网络诈骗。2016年，我们成立了针对电诈预防治理的技术研究专项小组，基于真实的电诈场景和问题探索全链路反制技术，并创新了基于可信AI的IMAGE“安全智能体系”，实现对电诈风险的早感知、快识别、准提醒以及协同行业伙伴的联防联控。

面向真实场景的产学研合作一直是我们前沿性技术探索的动能。我们长期与清华大学开展反诈课题科研合作，攻坚关键技术，也取得了丰富的成果。

蚂蚁始终致力于追求生态开放安全共建。在《反电信网络诈骗法》正式实施的这个重要时间点，我很高兴可以看到蚂蚁集团联合清华大学一起向业界分享我们在反诈技术研究方面的实践成果。面对这个长期的、攻坚性的课题，开放安全科技的能力工具，用科技助力数字经济健康发展。

1. 当前电信网络诈骗的特点

近年来诈骗手法多样、演变快速，典型的有兼职刷单类、仿冒类、杀猪盘、网络交友类、信贷类、色情类、游戏商品类、虚假购物类、中奖返利类9类手法，通过对这些电信网络诈骗行为的分析，白皮书总结了以下5个特性：

先兆性：欺诈在交易发生前具有一定的征兆。
群体性：不法分子数量规模庞大，其往往共属于某个群体，群体内的欺诈者在行为特征、IP所属地等信息上具备一定的相似性。
关联性：不法分子往往有自己的根据点，这些根据点包括特定的网站、账号等。同一个网站、账号、APP可能由不同的欺诈者维护，同一类型的根据点在使用的图片、文本等内容上也具有一定的相似性。
隐蔽性：欺诈手段形式形式多样、隐蔽性极高。
动态性：随着互联网技术的不断发展，恶意欺诈分子的诈骗手段也不断升级，传统静态的风控模型难以应对不断更新变化的欺诈形式。

2. 金融大数据反诈技术系统设计思路

上述风险特点对反诈系统来说，一方面提出了新的挑战，另一方面沿着这些特性顺藤摸瓜，可以针对性设计反制方案。

首先，传统的风控方案主要围绕事中（即交易发生中）进行检测与防护用于解决黑产的群体性和关联性问题。但因缺失部分事前信息，判断可能会有不准确性。

其次，根据欺诈的先兆性特点，可知欺诈发生前许多信息（例如舆情信息、站点风评等）对欺诈检测有辅助补充作用。而且，由于金融领域交易数据量庞大，对实时防控需求极高，风控系统利用先验知识在交易前对交易双方作出基本的判断可极大增加风控系统时效性。为此，事前（即交易前）欺诈风险的感知与预测十分必要。

最后，欺诈的动态性与隐蔽性特征表明，尽管事前事中的检测部署层层严密，仍然存在一些欺诈事件被“漏检”和“逃逸”的现象。为此，在事后（即交易后）的威胁反制与应对急需重视。

因而，金融反欺诈可分为三个阶段：事前阶段、事中阶段、事后阶段。一套完整的金融风控系统应当包括以下三项能力：在事前阶段实现欺诈风险感知与预测，在事中阶段实现攻击检测与防护，在事后阶段实现威胁反制与应对。

分阶段检测是金融风控需要遵循的上层运作逻辑，而搭建一套完善的金融风控系统还需要解决数据处理与算法设计的问题。反欺诈的三个阶段对数据与算法的需求具有相似性，因此，从数据与算法层面抽象出一套通用的底层基础设施，是整套框架的基石。

3. 金融反诈系统通用技术框架

在这个反诈业务背景和技术设计思路下，白皮书提出了如下框架。

首先在底层基础设施层面，通过构建多维异构超大规模交互图，实现大规模、强关联、异质、隐私数据的储存、调用与表征；在模型全链路安全上，即模型训练、模型部署、模型运营的三个阶段部署可信AI，以解决用户数据的隐私安全问题，提高模型的鲁棒性和可解释性，保障信息的真实性、决策的透明性和结果的公平性。详见白皮书第二章。

事前防控是一种新的防控思路，通过域外风险感知，将一些数据收集工作和相应的计算任务前置于风险发生，这是传统事中防控的有效补充。事前防控可以从全网威胁探测处理和全网情报采集处理两方面着手，白皮书介绍了其中的关键技术，包括风险内容定位、新风险感知定性、情报分类、情报要素提取等。详见第三章。

在事中风险防控阶段，白皮书介绍了风险交易发生时进行识别并做出风险决策的主要技术框架。事中防控的首要任务是风险识别，判断当前交易是否存在风险，存在什么样的风险。针对业务冷启动、风险检测、端云风险防控等核心问题，阐述了结构化数据/图数据异常检测、全图风控、端风控等关键技术；识别之后，有效的风险决策是识别能否起作用的关键。决策阶段核心目标是平衡风险与体验，白皮书介绍了基于决策有偏推断、交互式风控等技术的决策方案。详见第四章。

事后防控阶段主要处理三类问题。第一类问题是处理用户投诉，平台方需要对用户的投诉进行审理定性，基于事后信息，判断投诉相关的风险是否成立。这类问题的解决方案，称为智能审理。第二类问题是识别漏网之鱼，事后信息进行回溯反查的解决方案，称为类案检索。第三类问题是对风控体系进行事后回看，进行必要的复盘和调整，决定对事前事中的防控体系做出什么样的调整，这套解决方案，称为威胁知识提炼。第五章详细介绍了这三套方案的技术框架。

最后，白皮书介绍了事前、事中、事后三个业界实施案例，对相关技术在实战中的应用要点做了进一步说明。

结语

技术的发展是双刃剑，一方面帮助我们更好识别风险，另一方面黑产也越来越聪明，会利用这些能力向金融平台发起进攻，所以反电信网络诈骗注定是一场持久、激烈的攻防战役。学界和业界共同打造反诈技术生态，通过前沿理论和应用技术的合作分享抗击黑产，将有效推动行业进步。反诈白皮书的发布是蚂蚁集团联合清华大学在这条道路上迈出的一小步，欢迎相关产学界研究、工作者针对里面的问题和我们讨论，共筑反诈技术生态。

点击下载：金融大数据反诈技术白皮书.PDF

分享 ()收藏

评论加载中

月点击排行