银行业数据分类分级大模型来了!探索解决多项痛点
近日,“数据分类分级人工智能大模型暨高质量数据集建设成果交流发布会”召开。从央行到商业银行,有多家银行的相关负责人参加会议。
此次发布了银行业首个行业级“数据分类分级”大模型。该大模型旨在探索解决金融机构在数据分类分级工作中面临的标准理解不一、执行尺度不齐、自动化水平不足等痛点。
据悉,关于数据分类分级人工智能大模型,中国人民银行组织工行、农行、中行、建行、邮储银行、广发银行、中国银联、网联清算公司等机构,按照“共建、共享、共用、共治”原则协同攻关,通过凝练头部机构经验共识,再借助大模型转化为通用、自动化工具供给中小金融机构使用。
模型在保障较高识别准确率的基础上,大幅提升数据分类分级工作效率,具备本地部署、在线MaaS服务等模式,方便金融机构按需使用;通过协议约束、合规审查、数据脱敏、专家标注、权限管控等措施,强化数据采集、模型训练、部署运行全流程安全,做到合规安全。
据《银行科技研究社》了解,在银行业,数据分类分级本身受到关注。
《数据安全法》提到,国家建立数据分类分级保护制度,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对数据实行分类分级保护。
从银行业层面而言,《银行保险机构数据安全管理办法》第三章专门针对“数据分类分级”提出要求:
银行保险机构应当制定数据分类分级保护制度,建立数据目录和分类分级规范,动态管理和维护数据目录,采取差异化安全保护措施。
银行保险机构应当对机构业务及经营管理过程中获取、产生的数据进行分类管理,数据类型包括客户数据、业务数据、经营管理数据、系统运行和安全管理数据等。
银行保险机构应当根据数据的重要性和敏感程度,将数据分为核心数据、重要数据、一般数据。其中,一般数据细分为敏感数据和其他一般数据。
而在2026年1月,网信办还发布《金融信息服务数据分类分级指南(征求意见稿)》,指导提升金融信息服务数据安全水平。
据《银行科技研究社》了解,面对数据分类分级工作中的多项挑战,已有银行探索AI大模型在其中的应用。
例如,平安银行2025年报显示,在数据管理方面,其引入文本分类模型、大语言模型等技术,提升数据安全分类分级标签的覆盖度和准确率等。
2025年12月消息显示,南京银行联合阿里云完成银行数据安全分级分类项目的阶段性验证。在此项目中,工程师仅使用6000条训练数据,便实现了94.6%的准确率。
据悉,针对数据安全分级分类面临的挑战,南京银行与阿里云探索出一条技术路径——以通义千问大模型为核心,依托“模型飞轮”范式与通义点金飞轮平台,构建端到端的金融垂直领域模型生产能力。
其中,针对标注成本高的问题,团队应用阿里云提出的“模型飞轮”范式:先由更大尺寸的基座模型(如通义千问-Max)基于少量种子样本生成大量高置信度伪标签数据,再用于对通义千问3-4B进行监督微调与强化学习优化。这一过程实现了“以AI造AI”,在仅需6000条真实标注数据的情况下,等效获得了数万条训练样本的效果,缓解了数据瓶颈。
- 回顾数字人民币运营机构扩容:从4大行到22家,有19家为系统重要性银行
- 石基支付因收单违规、反洗钱不力收央行罚单
- 数字人民币运营机构扩容后,多家银行对外披露相关情况
- 数字人民币试点地区情况统计:江浙交易额排前二,港深联手扩大试点
- 2家股份行大模型新进展:中信银行落地超120个场景,平安银行超390个
- 回到2018年?信用卡4年减少一亿多张,银行正加强技术能力支撑
- 移动支付网早报3.31:三家支付机构发2025年财报,WeChat Pay HK可绑定Apple ID
- 通通AI社交:央行或于年底前审批银盈通控股权变更
- 移动支付网早报3.27:盛付通被央行罚没近300万,数字人民币App更新版本
- 首批稳定币牌照花落谁家?香港金管局:全力推进,适时公布!

粤公网安备 44030602000994号