金融科技创新应用分析:知识图谱是什么?怎么用?


2021-7-8 10:48来源:移动支付网    作者:陈拾九

6月4日,广州公示金融科技创新监管工具第二批创新应用项目,其中包括4个项目,涉及国有商业银行、股份制商业银行、科技企业、研究机构和监管机构。

在具体应用项目上,有两个项目使用到知识图谱技术,分别是《基于知识图谱技术的风险交易预警服务》和《基于知识图谱的外汇违法违规风险行为识别应用》,申请机构分别为农业银行广东分行和国家外汇管理局广东分局、广发银行。

知识图谱是什么?

有人说,现在我们的身边充斥着太多信息,多到让人无法找出自己想要的那些,这句话在某种程度上说明了问题。机器和软件不懂人类要什么,不知道什么是重要的,它们能做的就是将所有信息都罗列出来,这势必会造成大量无效信息的堆积。

知识图谱可以解决这个问题,通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法同计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的。

简单的说,知识图谱就是从大量的信息和数据中提取到有效的、重要的信息,过滤掉无效的、重复的信息,并以图谱形式展示。在逻辑上,知识图谱分为数据层、模型层两层结构。

数据层是一系列事实所组成,模型层则建立在数据层之上,是知识图谱的核心,在模型层存储的是经过提炼的知识。

知识图谱

举个例子,“拜登——总统——美国”、“拜登——年龄——78岁”属于知识图谱的模型层,其中“拜登是美国的总统”、“拜登今年78岁”则是属于数据层。

在这里面还有一个重要的概念:本体,在模型层的管理上,通常采用本体库来进行管理。本体是知识的抽象,大多数本体描述的都是个体(实例)、类(概念)、属性以及关系。如果我们要做图书领域的知识库或者知识图谱,首先要对图书进行分类,这个分类就是本体。

如何构建知识图谱?

知识图谱构建从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,并将其存入知识库的数据层和模型层,这一过程包含:信息抽取、知识表示、知识融合、知识推理四个过程,每一次更新迭代均包含这四个阶段。

信息抽取:从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;

知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;

知识加工:对于经过融合的新知识,要经过质量评估之后(部分要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量;

知识推理:基于图谱中已有的事实或关系推断出未知的事实或关系,一般着重考察实体、关系和图谱结构三个方面的特征信息。

可以很明显的看出,知识图谱并不是一次性生产的,而是一个慢慢积累的过程,需要使用大量数据不断的循环往复迭代更新。

知识图谱:有效提高性能

前文我们说起过,机器和软件不懂人类要什么,只能将信息大量的罗列,知识图谱的目的就是解决这个问题,而解决的方式,是让机器和软件获得“理解”和“解释”两个能力。

之所以要让机器和软件获得这两个能力,是因为目前人工智能的性能不能满足人们的需求。很多人都认为,只要有足够多的数据,人工智能就可以通过统计模型计算出一切。

但事实上,基于统计模型的人工智能只能寻找不断重复出现的模型,而不能寻找“有意义”的模型,它不能“理解”问题,得到的结果也无法“解释”。计算效果已经接近“天花板”,这样的人工智能通常都非常脆弱,容易受到攻击或者欺骗。

但是如果使用知识图谱,就可以让人工智能“理解”人类的自然语言,可以不断整合现有数据、外部数据,让机器形成认知能力,去理解这个世界。可以有效降低人工智能的大样本依赖,提高学习的经济性和对先验知识的利用效率,增强人工智能与先验知识的一致性。

另外,图式的数据存储方式,相比传统存储方式,数据调取速度更快,图库可计算超过百万潜在的实体的属性分布,可实现秒级返回结果,真正实现人机互动的实时响应。

知识图谱在金融领域的应用

金融机构在业务运行过程中累积了大量的知识与经验,这些知识与经验存在于该领域专家脑中或技术文档中,很难得到有效利用。在面对海量交易流水数据时,没有相应的知识与经验,难以有效追踪资金全链路流程,对可疑交易行为不能进行有效关联。

知识图谱则可以利用自身在实体、属性等客观世界事物的关联关系分析方面的优势,解决这些问题。《基于知识图谱技术的风险交易预警服务》和《基于知识图谱的外汇违法违规风险行为识别应用》两项金融科技创新应用就是基于这个优势。

以反洗钱为例,基于传统关系型数据库的反洗钱模型,知识图谱可根据汇款信息路径和客户信息反映出汇款异常或款项来源与实际收入不符等异常现象,从而发现洗钱风险,及时上报银行进行风险管控,并实现反洗钱数据可视化。

事实上,目前已经有银行、第三方支付机构落地了类似的项目。2020年4月,翼支付反洗钱图谱关联模型监测到一个以多交易主体为核心、大量交易对手组成的异常转账群组。该群组账户关系组成复杂、账户间相互转账频繁、群组内资金分散特征明显,图谱关联模型及时向反洗钱人员进行预警。

通过一系列关联风险分析能力及功能运算,反洗钱人员迅速整理出该关系网内涉及的一批可疑主体以及两个月内的资金链路流向。经初步判定,该群组疑似从事“套现贷”非法活动,主要方式就是通过名下支付账户互相转账,用来偿还信用卡额度,并延长信用卡还款期限。

近日,世界人工智能大会组委会正式公布最高奖项2021 SAIL奖TOP30榜单。交通银行作为唯一一家金融机构,凭借“基于复杂知识图谱的风险监测”项目,从众多海内外头部企业和学术科研机构的优秀项目中脱颖而出,成功入围TOP 30榜单。

本文为作者授权发布,不代表移动支付网立场,转载请注明作者及来源,未按照规范转载者,移动支付网保留追究相应责任的权利。
评论加载中
相关文章

月点击排行
关于本站    联系我们    版权声明    手机版
Copyright © 2011-2022 移动支付网    粤ICP备11061396号    粤公网安备 44030602000994号
深圳市宇通互联信息技术有限公司    地址:深圳市宝安区新安街道28区宝安新一代信息技术产业园C座606