清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

有热心粉丝私信问我,在个人信息法愈发严格的当下,参与辅助风控的助贷机构如何确保个人数据的传输安全?技术落地如何实现?我会心一笑~

早在两年前我还在放贷机构时,该问题就曾经困扰我。通过一轮轮分析调研,当时找到的最优答案就是隐私计算。通过招投标选型及数字化改造,我们趟过了一个个“天坑”,落地验证后效果不错。

我将行业调研、法律内核剖析、隐私产品选型、合规化配套改造等一系列思考和体悟汇总,撰写了关于隐私计算的系列文章。现针对热心粉丝问题,单独回复一期,供大家研究讨论。

隐私计算是数据流通的标配

从实践看,隐私计算有助于实现一定条件下的匿名化;相比较传统加密方式,隐私计算更符合“最小必要”合规要求,有效防止了数据滥用;其中的差分隐私等隐私计算技术将有助于个人信息处理者讲清楚自身责任,甚至实现免责;而同态加密、秘密分享等技术则属于《信息安全技术 个人信息去标识化指南》(国家标准GB/T 37964-2019)中高级的去标识化手段。

因此,行业普遍认为隐私计算是个保法要求下数据流通的标配(详细分析见公号文章:《为什么说“隐私计算是个保法要求下的必然选择”》

隐私计算的应用场景

我们常见的分类是按照需求场景分类,可分为:单向查询类、联合统计类、风控建模类、精准营销类等;还有一些分类是按照技术路径、流派分类,如按照解决思路的不同将隐私计算分为多方安全计算(MPC)、联邦学习(FL)和可信执行环境(TEE);也有按照最底层的密码协议分类为同态加密、秘密分享、零知识证明、混淆电路、不经意传输等。

我们从助贷机构的具体需求出发,将隐私计算需求场景分为两大类:涉及数据外采类场景、不涉及数据外采类场景。

不涉及数据外采的场景是指助贷机构之间具备数据和应用场景的情况,例如集团内子公司之间的联合统计、多家机构间黑名单共享反欺诈、地方政务平台和银行联合建模用于中小微企业贷款风控等。

这类场景具备数据,同时需求明确,缺少的只是隐私计算技术,因此一拍即合。2021年落地的隐私计算项目基本上都属于该种情况(具体名单见公号文章:《金融机构如何选择隐私计算技术和公司》)。

另一类场景是涉及数据外采的场景,需要从不确定的数据源厂商引入大量外部数据,主要是 to C贷款时引入外部数据源进行反欺诈、A卡、B卡建模,或是引入外部数据源对存量客户进行精准识别与营销。在以往的明文建模时期,上述场景需要从不止一家数据源厂商中引入大量外部数据,丰富入模入参数据维度,或互补形成覆盖度更高的黑灰名单库。

《个人信息保护法》生效后,很多数据源厂商获取数据以及转售卖的合法性存疑,同时需要投入资源部署隐私计算产品,多数数据源厂商纷纷停止或暂停输出数据,导致当前市场上基本没有合规、优质的三方数据用于反欺诈、A卡、B卡和联合营销建模,现有模型效果大打折扣,金融机构痛点需求愈发阻滞。

这也是当前隐私计算行业普遍存在的问题:隐私计算厂商往往只具备隐私计算产品,但并未对接合规数据源,因此只能满足不涉及数据外采的场景需求,无法解决当前反欺诈、A卡、B卡和联合营销建模需求。而在助贷机构量化分析场景中,后者需求最为迫切,数据采购金额占绝大部分。

我们了解到,很多头部隐私计算公司正在全力拓展数据源厂商,然而并不是所有数据源均能够通过隐私计算实现对外输出。对于拓展何种数据源、如何进行合规化改造,笔者在文章《金融业外采数据法律隐患与改造建议》中有详细阐述,在此摘录主要结论如下:

  • 最好为一手数据源,看数据源厂商通过服务在获取个人信息时的告知和授权内容及范围,是否包含可以对外输出的部分;
  • 结合此次数据输出服务内容和范围,是否可以包含进上述告知和授权范围之中;
  • 数据需求方在进行告知和获取授权时,应明确数据来源、使用数据的内容、范围和目的;
  • 更合规的方式是,数据源厂商应在需求方告知和获取授权时,在其获取的个人信息范围内,对客户进行二次告知并取得授权,并明确告知需求方(接收方)的名称、联系方式、处理目的、处理方式和信息种类。

基于上述分析,结合数据源厂商意愿,当前数据质量较好、且对隐私计算接受度较高的厂商主要有:银联、移动通讯运营商、蚂蚁腾讯等头部互联网公司。

风控流程和技术框架重构

现实中由于因数据性状和业务流程等因素的不同,不同机构的建模流程不尽相同。笔者仅以自身实操案例讲解隐私计算产品对建模和技术框架流程造成的重构。

我们先看一下明文建模的流程:先搭建了“统一数据对接平台”实现外部数据的统一采集,“统一数据对接平台”可植入路由策略,以实现诸如黑名单数据源轮询方式实现外部黑名单并集等操作;“统一数据对接平台”与企业自身数据中台共同接入“决策引擎”,实现多维数据同时入模入参,并形成策略后输出。

决策引擎中的模型和策略是通过事前、离线地反复训练得来,主要是将企业自身数据中台中的客户样本、特征值和坏样本,与外部样本撞库后,通过反复建模调优得来。模型和策略一经验证定性便植入“决策引擎”中用于生产执行。当然,具体实施时还要遵循“AB-test”方法逐步上线。

使用隐私计算产品后,由于助贷机构的离线建模和训练策略的过程,与生产环境下实时跑批生成决策的过程,完全一致且全部置于隐私计算产品环境之中。同时,助贷机构无法掌握模型全貌而将完整模型部署在“决策引擎”之中,因此会导致建模技术实现流程的较大改变。

此时的建模技术流程为:将企业自身数据中台和隐私计算产品平台对接,以实现进件数据和外部数据实时、线上入模入参并形成策略,策略仅通过“决策引擎”的组合、并行、串行、分流等策略调度模块实现落地。注意,此时的“决策引擎”失去了部署模型和跑批结果的功能,仅保留策略调度功能;“统一数据对接平台”失去作用,被隐私计算产品替代(若涉及隐私计算下的多方数据建模,则可能还会发挥作用,但目前多数隐私产品不支持多方建模)。

合规数据源的减少、建模技术流程的调整、暂不支持多方联合建模均是企业面临的调整成本,是为更加符合个人信息保密所必须付出的成本。既然付出了高昂成本,请务必高度重视品的测试工作,以“实事求是”的思路推动产品的优化与成长,在帮助企业“解决实际问题”的同时,推动隐私计算行业快速、健康发展。

配套工程

隐私计算只是解决了数据安全传输的问题,可需求方的核心诉求并不是数据,而是基于数据价值挖掘的对决策的优化建议。打个比方,数据需求方要的是一盘菜,并不是这盘菜的食材。这就要求供应商先找到合适的食材,快速安全地运到饭店,加工成配菜,最终交由大厨烹饪出来。这就需要对应具备合规数据的连接能力、隐私计算能力、数据治理能力、量化分析能力以及对整个流程的合规方案设计能力。

针对这些问题,助贷机构要与隐私计算厂商一起打造“五位一体”的全链路解决方案。

合规方案设计方面,需针对自身数据应用场景,制定全套隐私政策、授权方案、信息安全评估方案以及数据全生命周期管理流程。量化分析能力方面,有必要建立量化分析团队,熟知个保法及金融行业相关技术标准要求,与数据源公司成立联合风控实验室。

数据治理方面,按照金融行业隐私数据分级分类管理办法等相关要求对现有数据进行整改。内外数据连接方面,要选择通用型、适配性好的隐私产品广泛对接更多的数据源公司,联合打造隐私数据生态。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。