公司动态新冠相关信息公示

米兰官网-防御“后门”、模型遗忘！他们守护AI数据安全—新闻—科学网

2025-11-09 17:15:17 999+ 公司动态

两个富人，出在好奇心，想比力到底谁更富有，但又不想让对于方知道本身“家底”，该用甚么要领？

于科学界，它被称为“姚氏百万财主问题”，由计较机科学专家姚期智提出，也使为实现数据“可用不成见”的安全多方计较研究，获得学界存眷。

于2024年度中国电子学会科学技能奖励年夜会上，西安电子科技年夜学收集与信三木SEO-息安全学院传授马卓团队牵头完成的“开放情况下智能模子数据安全要害理论与技能”项目获天然科学奖二等奖，该项目于多方数据安全同享、异样数据逆向追溯与修复等方面实现冲破，有用减轻企业数据同享的隐私泄露危害。

安全危害的“不确定性”

提起“开放情况下的智能模子”，不少人也许感应生疏，但对于它于糊口中的运用却再认识不外，比力典型的有金融风控、智能无人机、主动驾驶体系、智能家居等。

马卓注释说：“通俗讲就是人工智能模子，但开放情况中，数据来历多样、节点漫衍疏松、体系界限不固定，进犯者轻易浑水摸鱼。”于现实运用中，数据交互、模子推理等环节，均可能被进犯者窃取隐私、污染数据，致使呈现隐私滥用、模子误导等问题。

作为被进犯方针，模子面对的危害不只“某一个”，而可能分离于数据、建模、部署各流程，进犯类型也更繁杂多样。好比，数据来历多样，象征着进犯方可以假装成一个平凡的数据提供者，于模子构建练习数据集的历程中，植入“问题”数据，进犯情势则可能经由过程某个数据收罗传感器倡议，也可能经由过程某一个机构倡议。

马卓和其团队的事情，就是从全流程角度防备危害：发明它、解决它！

一般而言，防备有“事先”“事中”及“过后”三个阶段：于模子练习前的数据集构建阶段，要扫描定位异样数据；于模子练习中，则引入可以或许抵御此类“问题”数据的鲁棒性进修要领，简朴来讲，有点像人体的免疫力，可以构建起人体的“防火墙”，使模子越发“硬朗”“皮实”“耐造”，要害时辰不“失链子”，从而使呆板进修模子于面临异样数据、噪声滋扰、漫衍偏移等倒霉前提时，仍能连结不变性及有用性的能力；于模子完成练习后，则对于模子举行扫描并消弭“问题”数据对于在模子的影响。

“做这些，还有是为了实现模子‘高可用’”，马卓说，“‘不成用’的安全实在没有效，安全也要寻求低成本、高效率，晋升模子机能”。

团队于测试。西安电子科技年夜学供图

给异样数据”动手术“

文章开首说起的“姚氏百万财主问题”中所假定的情景，于多个行业都存于。以金融风控为例，建模时经常要对于A银行及B银行数据求交集，此历程可能存于隐私泄露危害，传统加密要领繁杂渡过高，好比没法很利益理非交集的数据，删除了可能使隐私袒露，会孕育发生较冗长的数据，致使模子练习变慢，难以范围化运用。

马卓领导团队提出的系列超轻量级安全计较要领，撑持包括多方数据加密、线性/非线性函数安全计较等于内的多种数据安全计较操作。他注释道：“咱们就是想措施去除了冗余，让有限数据介入练习，同时提高非线性运算（如对于数、指数、开方运算等）算子的速率，让前期数据处置惩罚变患上高效安全。”

于数据处置惩罚以外，团队还有对准模子部署后的异样数据快速定位，及模子的高效修复问题，前者是怎样更快地确定异样数据，后者则像对于异样数据“动手术”，实现精准断根，包管模子“康健”运行。

异样数据，凡是分数据投毒及后门植入两年夜类型。前者相对于轻易理解，后者则是一种形象说法，指的是进犯者经由过程污染数据或者修改架构等要领，于模子中注入的隐蔽举动，就像一扇可以通往模子的“门”，常日里，它就像“卧底”“特务”同样，连结静默，但一旦被“触发”，就可能致使模子呈现异样举动。

马卓说，“之前的要领是穷举，把所有数据‘搂’一遍，咱们此刻则是经由过程近似在类似计较的要领找到它们，履行效率可晋升两个数目级以上”。

发明数据异样，接下来就是把它们从模子中“请”出去。之以是要“请”，是由于异样数据很“奸刁”，不仅“隐身”技术强，并且嵌套于模子中，假如把模子比作年夜脑，异样数据就可能“藏”于脑神经细胞，处置惩罚这些数据，其繁杂度不亚在有些神经外科手术。

模子遗忘计谋

颠末团队努力攻关，终极研发出“基在梯度上升的模子遗忘计谋”方案，能于不从头练习模子的环境下，精准消弭异样数据对于在模子决议计划的滋扰。

练习模子的要害于在让模子“记住”数据和其特性，模子后门孕育发生的焦点缘故原由，于在它“记住”了后门数据，并且后门数据不仅包罗问题数据特性，也包罗必然的正常数据特性。

“咱们反其道而行之，让模子学会‘遗忘’，不克不及多也不克不及少，恰如其分地选择性掉忆，把异样数据从模子中‘打消’失”，马卓说。

从数学角度看，梯度降落法，就是沿梯度降落的标的目的求解极小值。假定一小我私家正于山顶，担忧气候突变或者夜路伤害，需要尽快下山，于包管安全的条件下，一个好的要领就因此当前位置为基准，只管即便沿坡度最陡之处往下走，为实现总体最优，每一隔一段间隔要从头校准定位坡度，继承下山。素质上，梯度降落法表现着一种模子练习的优化思维。

除了了能为模子“排毒”外，这类要领还有能像人们利用社交软件“撤回”信息同样，给模子部署机构或者平台，提供“撤回数据”的选择，特别于多方介入数据同享的模子中，这既保障了部门介入方的数据隐私权，也能于某个机构退出互助时，最年夜水平削减数据“撤出”对于模子正常运行的影响。

学会正向”卷“本身

于马卓看来，团队最近几年来聚焦攻关的这个项目，是团队“发明的一个比力成心思的范畴”，于研究结果发表前，国际上相干文章其实不多。

团队合影。西安电子科技年夜学供图

团队由多名持久从事人工智能安全、暗码学与隐私计较标的目的的青年主干西席构成，涵盖算法理论、体系架构与工程实现等多条理研究气力，并吸引多名博士后及研究生配合介入。最近几年来，团队产出了一系列具备自立常识产权的立异结果，广泛运用在现实场景。

对于在学生的造就，于马卓看来，测验对于学生只是基本要求，想要“出类拔萃”，就要“学他人不克不及学，做他人不克不及做“。“我此刻更像一个教导员，去调动他们的踊跃性，让学生知道读年夜学、研究生的意义及目的，学会正向地‘卷’本身”。

相干论文信息：https://doi.org/10.1109/INFOCOM48880.2022.9796974

上一篇：米兰官网积极响应国家号召，进一步提升八因子可及性下一篇：一线“佑”选，安护新生——安佑平®获批用于全人群复发/转移性头颈部鳞癌治疗

新闻中心

米兰官网-防御“后门”、模型遗忘！他们守护AI数据安全—新闻—科学网

最新资讯

米兰官网积极响应国家号召，进一步提升八因子可及性

从头颈鳞癌到肝癌！安佑平®获批两大适应症

一线“佑”选，安护新生——安佑平®获批用于全人群复发/转移性头颈部鳞癌治疗

安佳因®儿童适应症上市一周年