新闻中心

News

公司动态 新冠相关 信息公示

米兰官网-防御“后门”、模型遗忘!他们守护AI数据安全—新闻—科学网

2025-11-09 17:15:17 999+ 公司动态

     

两个富人,出在好奇心,想比力到底谁更富有,但又不想让对于方知道本身“家底”,该用甚么要领?

于科学界,它被称为“姚氏百万财主问题”,由计较机科学专家姚期智提出,也使为实现数据“可用不成见”的安全多方计较研究,获得学界存眷。

于2024年度中国电子学会科学技能奖励年夜会上,西安电子科技年夜学收集与信三木SEO-息安全学院传授马卓团队牵头完成的“开放情况下智能模子数据安全要害理论与技能”项目获天然科学奖二等奖,该项目于多方数据安全同享、异样数据逆向追溯与修复等方面实现冲破,有用减轻企业数据同享的隐私泄露危害。

安全危害的“不确定性”

提起“开放情况下的智能模子”,不少人也许感应生疏,但对于它于糊口中的运用却再认识不外,比力典型的有金融风控、智能无人机、主动驾驶体系、智能家居等。

马卓注释说:“通俗讲就是人工智能模子,但开放情况中,数据来历多样、节点漫衍疏松、体系界限不固定,进犯者轻易浑水摸鱼。”于现实运用中,数据交互、模子推理等环节,均可能被进犯者窃取隐私、污染数据,致使呈现隐私滥用、模子误导等问题。

作为被进犯方针,模子面对的危害不只“某一个”,而可能分离于数据、建模、部署各流程,进犯类型也更繁杂多样。好比,数据来历多样,象征着进犯方可以假装成一个平凡的数据提供者,于模子构建练习数据集的历程中,植入“问题”数据,进犯情势则可能经由过程某个数据收罗传感器倡议,也可能经由过程某一个机构倡议。

马卓和其团队的事情,就是从全流程角度防备危害:发明它、解决它!

一般而言,防备有“事先”“事中”及“过后”三个阶段:于模子练习前的数据集构建阶段,要扫描定位异样数据;于模子练习中,则引入可以或许抵御此类“问题”数据的鲁棒性进修要领,简朴来讲,有点像人体的免疫力,可以构建起人体的“防火墙”,使模子越发“硬朗”“皮实”“耐造”,要害时辰不“失链子”,从而使呆板进修模子于面临异样数据、噪声滋扰、漫衍偏移等倒霉前提时,仍能连结不变性及有用性的能力;于模子完成练习后,则对于模子举行扫描并消弭“问题”数据对于在模子的影响。

“做这些,还有是为了实现模子‘高可用’”,马卓说,“‘不成用’的安全实在没有效,安全也要寻求低成本、高效率,晋升模子机能”。

团队于测试。西安电子科技年夜学供图

?

给异样数据”动手术“

文章开首说起的“姚氏百万财主问题”中所假定的情景,于多个行业都存于。以金融风控为例,建模时经常要对于A银行及B银行数据求交集,此历程可能存于隐私泄露危害,传统加密要领繁杂渡过高,好比没法很利益理非交集的数据,删除了可能使隐私袒露,会孕育发生较冗长的数据,致使模子练习变慢,难以范围化运用。

马卓领导团队提出的系列超轻量级安全计较要领,撑持包括多方数据加密、线性/非线性函数安全计较等于内的多种数据安全计较操作。他注释道:“咱们就是想措施去除了冗余,让有限数据介入练习,同时提高非线性运算(如对于数、指数、开方运算等)算子的速率,让前期数据处置惩罚变患上高效安全。”

于数据处置惩罚以外,团队还有对准模子部署后的异样数据快速定位,及模子的高效修复问题,前者是怎样更快地确定异样数据,后者则像对于异样数据“动手术”,实现精准断根,包管模子“康健”运行。

异样数据,凡是分数据投毒及后门植入两年夜类型。前者相对于轻易理解,后者则是一种形象说法,指的是进犯者经由过程污染数据或者修改架构等要领,于模子中注入的隐蔽举动,就像一扇可以通往模子的“门”,常日里,它就像“卧底”“特务”同样,连结静默,但一旦被“触发”,就可能致使模子呈现异样举动。

马卓说,“之前的要领是穷举,把所有数据‘搂’一遍,咱们此刻则是经由过程近似在类似计较的要领找到它们,履行效率可晋升两个数目级以上”。

发明数据异样,接下来就是把它们从模子中“请”出去。之以是要“请”,是由于异样数据很“奸刁”,不仅“隐身”技术强,并且嵌套于模子中,假如把模子比作年夜脑,异样数据就可能“藏”于脑神经细胞,处置惩罚这些数据,其繁杂度不亚在有些神经外科手术。

模子遗忘计谋

颠末团队努力攻关,终极研发出“基在梯度上升的模子遗忘计谋”方案,能于不从头练习模子的环境下,精准消弭异样数据对于在模子决议计划的滋扰。

练习模子的要害于在让模子“记住”数据和其特性,模子后门孕育发生的焦点缘故原由,于在它“记住”了后门数据,并且后门数据不仅包罗问题数据特性,也包罗必然的正常数据特性。

“咱们反其道而行之,让模子学会‘遗忘’,不克不及多也不克不及少,恰如其分地选择性掉忆,把异样数据从模子中‘打消’失”,马卓说。

从数学角度看,梯度降落法,就是沿梯度降落的标的目的求解极小值。假定一小我私家正于山顶,担忧气候突变或者夜路伤害,需要尽快下山,于包管安全的条件下,一个好的要领就因此当前位置为基准,只管即便沿坡度最陡之处往下走,为实现总体最优,每一隔一段间隔要从头校准定位坡度,继承下山。素质上,梯度降落法表现着一种模子练习的优化思维。

除了了能为模子“排毒”外,这类要领还有能像人们利用社交软件“撤回”信息同样,给模子部署机构或者平台,提供“撤回数据”的选择,特别于多方介入数据同享的模子中,这既保障了部门介入方的数据隐私权,也能于某个机构退出互助时,最年夜水平削减数据“撤出”对于模子正常运行的影响。

学会正向”卷“本身

于马卓看来,团队最近几年来聚焦攻关的这个项目,是团队“发明的一个比力成心思的范畴”,于研究结果发表前,国际上相干文章其实不多。

团队合影。西安电子科技年夜学供图

?

团队由多名持久从事人工智能安全、暗码学与隐私计较标的目的的青年主干西席构成,涵盖算法理论、体系架构与工程实现等多条理研究气力,并吸引多名博士后及研究生配合介入。最近几年来,团队产出了一系列具备自立常识产权的立异结果,广泛运用在现实场景。

对于在学生的造就,于马卓看来,测验对于学生只是基本要求,想要“出类拔萃”,就要“学他人不克不及学,做他人不克不及做“。“我此刻更像一个教导员,去调动他们的踊跃性,让学生知道读年夜学、研究生的意义及目的,学会正向地‘卷’本身”。

相干论文信息:https://doi.org/10.1109/INFOCOM48880.2022.9796974

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请于正文上方注明来历及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。-米兰官网