本报记者李晖北京报道
随着数据要素市场培育提速,隐私计算作为数据安全流通的关键技术,如何加快其技术开发以及商业化的速度成为市场关切。
市场共识在于,在隐私计算“商业化大网”中,算法迭代、开源生态和场景普及缺一不可。去年10月,央行等部门联合印发《关于规范金融业开源技术应用与发展的意见》,强调“鼓励开源技术提供商,加快提升技术创新能力,切实掌握开源技术核心代码,形成自主知识产权,夯实产业支撑能力”。
《中国经营报》记者从多位业内人士处了解到,当前国内开源方日渐增多,但依据的相关标准自成体系,目前金标委、银行业协会、信通院等机构均在加快相关工作,与业界共同推动开源技术标准建设与信息化规划的衔接配套。记者近期获悉,蚂蚁集团已正式开源其隐私计算框架。
市场培育亟须技术降门槛
国家工信安全中心测算数据显示,“十四五”期间,我国数据要素市场规模将突破1749亿元,整体上进入高速发展阶段。作为解决数据安全流动的关键技术,隐私计算行业的发展备受关注。
IDC数据显示,2021年中国隐私计算市场规模已突破8.6亿元,未来有望实现110%以上的市场增速。艾瑞咨询预计,到2025年,中国隐私计算市场规模将达到145.1亿元。
市场规模爆发与市场需求和技术普及速度高度相关。在蚂蚁集团隐私智能计算技术部总经理王磊看来,数据交易要素市场化存在四个关键因素,分别是高价值数据源、产业化应用、数据交易市场和隐私计算技术,但四个要素目前均面临亟须解决的问题。
“数据交易市场目前的确权和定价机制是不太完善的,市场上也缺乏高价值数据,目前隐私计算的产业化应用更多是在金融领域的风控环节和少量营销场景,场景不够丰富,这也是蚂蚁集团决定开源其隐私计算框架的重要原因。”王磊表示。
中国信通院调研统计显示,55%的国内隐私计算产品基于或参考了开源项目。一位隐私计算创业公司人士向记者透露,从技术开发的供给侧看,如果每遇到一个新场景都从头开发,不但导致技术资源浪费,而且数据安全和隐私合规很难保证。从银行等金融机构需求侧看,不同技术路线的隐私计算产品在互联互通上存在先天壁垒,也加重了数据孤岛问题。
此外,隐私计算自诞生起就存在“数据黑盒”问题。在算法监管日益严格的当下,开源通过算法协议和实现方案的公开可验证有利于使用者了解其技术逻辑,促进技术透明化,并及时发现问题。
记者注意到,近年来监管、消费者权益保护及自身风控等对算法和模型的安全性及可解释性的要求越来越高,也推动了行业技术透明化趋势。比如,《个人信息保护法》明确要求,自动化决策结果对个人权益有重大影响时要能说明清楚原因;2021年3月,央行发布并实施的《人工智能算法金融应用评价规范》也要求,应用AI算法需满足安全性和可解释性;2022年年初,银保监会颁布《银行业、保险业数字化转型指导意见》,其中特别提到防范模型和算法风险,要求确保模型的可解释性和可审计性。
这种“可解释性”其实面向了金融业务中的多个相关方。华夏基金董事总经理、首席数据官兼首席技术官陈一昕向记者表示,“可信”即包含了“可解释性”的含义。对开发者来说,可以保证后续调优改进过程的有效进行;对于应用用户,比如保险保费定价系统的客户而言,可以为模型给出的不同定价结果做出详细说明;对于金融监管者,可以保证其从全流程上对AI模型进行约束并防范金融风险。
据记者了解,蚂蚁集团的隐私框架“隐语”主要定位于解决技术先进性和技术长期发展问题。相对于国内侧重某一类技术的开源平台,其通用框架目前支持包括多方安全计算(MPC)、联邦学习(FL)、可信执行环境(TEE)等在内的多种主流隐私计算技术,也支持多种技术进行灵活组合。同时,“隐语”已向社区开放了多方安全计算和联邦学习的核心代码。
上述多技术灵活组合的趋势也是降低行业使用门槛的一种方式。中国信通院云大所大数据与区块链部副主任闫树向记者表示,去年以来,隐私计算行业出现几个明显趋势:第一是如何加速性能;第二是如何提升产品稳定性;第三是真正从操作、算法二次开发、方便部署、说明文档等方面降低使用者门槛。整体看,适配不同场景,不同规模的数据,在安全和性能之间再平衡的产品越来越多。
标准化建立需求迫切
事实上,伴随去年隐私计算进入“商业化试点”后,技术路线赛马的现象日益明显。
记者不完全统计,近年来,国内外很多大厂和创业团队都在积极开源,在隐私计算技术范畴,至少包括百度的PaddleFL、MesaTEE,阿里达摩院的FederatedScope等。其中,较为知名的是由工商银行、中国银联、微众银行、VMware、星云Clustar等多机构共同治理的FATE开源项目/社区。此外,由产学研用近50家单位联合发起的国内首个国际化自主可控隐私计算开源社区——开放群岛(Open Islands)开源社区也在今年5月成立。
各技术流派的公司各自为战,采用不同的技术架构,开源软件的标准并不一致,这也导致不同技术范式之间很难连通,不仅给金融机构的决策带来难题,还可能形成数据“大孤岛”。因此,加快推进开源隐私计算技术应用的标准化已成为业界共识。
记者了解到,目前多个相关部门已推动隐私计算相关技术标准建立。闫树向记者表示,从标准体系层面规范隐私计算跨平台互联互通势在必行,中国信通院云大所牵头的隐私计算联盟、大数据技术标准推进委员会(TC601)也正在推进相关技术标准的研讨和编写。
中国银行业协会首席信息官高峰指出,开源软件需要遵循相应的工作标准,包括流程标准、技术标准、运营标准、推广标准、知识产权与法律标准等。中银协倡导各会员机构,加强开源技术及应用标准化建设,瞄准一些急需的、重点的领域,加快标准制定与实施。加强开源技术标准建设与信息化规划的衔接配套,依法合规使用开源技术。
“虽然《个人信息保护法》和《数据安全法》已经出台,但实践中尚无法律判例,技术在一些场景使用时会逐步迭代,法律界和技术界会根据实践逐步取得一些共识,互相推动前进。”王磊表示。
此外,面对目前市场上的众多开源方,开发方和使用机构更关注哪些指标?王磊指出,银行在招标和共建时主要关注技术的易用性和合规性,如果一个框架使用门槛高就很难用起来。另外,比较关注技术合规标准问题,但这方面行业仍在摸索阶段。
一位股份制银行技术部门人士向记者透露,目前在各种隐私计算的开源框架中,联邦学习开源框架相对比较成熟并逐渐形成主流,大型商业银行通常考虑在成熟框架上自研,从联合开发起步。
王磊同时指出,目前很多隐私计算产品的标准化程度比较低,定制压力大。相关技术和产品的标准化,将有利于推动隐私计算行业的商业化。
闫树认为,隐私计算跨平台互联互通不只需要在技术层面进行攻关,更需要在商业层面继续突破。需要充分结合具体业务的落地需求,可以在研讨编写技术标准的同时,同步推广运营实施标准。
而与创业性公司相比,大厂在技术培育的周期上普遍拥有更多耐心。王磊认为,盈利不是这一业务当前的最大诉求,由于隐私计算是助力整个国家数据要素市场化建设的关键技术,未来数据要素市场形成后会有很多新的商业化机会。