AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

密码学与安全研究快报

相关分类

计算机科学

Computer Science

人工智能

Artificial Intelligence

计算与语言

Computation and Language

计算复杂性

Computational Complexity

计算机科学

Computer Science

人工智能

Artificial Intelligence

计算与语言

Computation and Language

计算复杂性

Computational Complexity

最新研究

数据所有者如何说不? 网络刮除视觉语言AI训练数据集中数据同意机制的案例研究

互联网已成为培训现代文本到图像或视觉语言模型的主要数据来源,但越来越不清楚用于培训人工智能系统的网络规模数据收集实践是否充分尊重数据所有者的意愿。忽视所有者对数据使用的同意,不仅引起了道德问题,而且最近也被提升到了版权侵权案件的诉讼。在这项工作中,我们的目标是揭示数据所有者同意AI抓取和培训的信息,并研究它在DataComp中的表现,DataComp是一个128亿文本图像对的流行数据集。我们检查样本级信息,包括版权声明、水印和元数据,以及网络域级信息,例如网站的服务条款(ToS)和机器人排除协议。我们估计至少有122M的样本在CommonPool中表现出一些版权声明,并发现前50个域名中有60%的样本来自ToS禁止抓取的网站。此外,我们估计9-13%,其中95%的置信区间样本含有水印,其中现有的水印检测方法无法高保真度捕获它们。我们的整体方法和研究结果表明,数据所有者依靠各种渠道来传达数据同意,其中目前的AI数据收集管道并不完全尊重。这些发现强调了当前数据集策划/发布实践的局限性,以及考虑到人工智能目的的统一数据同意框架的必要性。

计算机与社会人工智能密码学与安全

PrometheusFree:光学神经网络中激光故障注射攻击的并发检测

基于硅光子学的AI加速器(SPAA)被认为是有前途的AI加速器,可实现高能效和低延迟。虽然许多研究人员专注于提高SPAA的能源效率和延迟,但他们的物理安全性直到最近才受到关注。虽然提供强大的光学神经网络推理方法至关重要,但它们的成功和采用取决于它们提供安全执行环境的能力。为此,本文提出了PrometheusFree,一种能够并发检测激光故障注入攻击的光学神经网络框架。本文首先对SPA提出了激光故障注入攻击的示例性威胁,能够将光学神经网络引入错误分类。然后通过开发同时检测激光故障喷射攻击的技术来解决本文中的威胁。此外,本文介绍了波长划分扰动(WDP)技术的一种新颖应用,其中利用波长依赖的矢量矩阵乘法(VMM)结果来提高故障攻击检测精度。模拟结果表明,PrometheusFree实现了超过96%的攻击引起的错误预测召回,因为使用WDP技术将攻击成功率平均降低了38.6%。与以前的技术相比,PrometheusFree将平均攻击成功率限制在0.019,减少了95.3%。实验结果证实了并发检测的优越性以及WDP方法所赋予的攻击检测能力的提升。

光学密码学与安全

用于 SIMO 场景中低延迟 5G 设备识别的通道稳健 RFF

超低延迟是第五代移动通信(5G)的标志,对识别也提出了严格的时间要求。当前的加密解决方案引入了额外的计算开销,从而导致更高的识别延迟。射频指纹(RFF)识别物理层的设备,阻止冒名攻击,同时显著降低延迟。不幸的是,多路径通道损害了RFF的准确性,现有的通道弹性方法需要跨多个时间点的反馈或处理,从而产生额外的信号延迟。为了解决这个问题,本文引入了一种新的RFF提取技术,该技术采用来自多个接收天线的信号来解决多路径问题,而不会增加延迟。与单域方法不同,使用来自多个天线的联合时序信道频率响应(CFR)的Log-Linear Delta Ratio(LLDR)来保存判控RFF功能,从而消除多时间采样并缩短采集时间。为了克服依赖最小信道变异的挑战,将频段分割成子波段,LLDR在每个子频段内单独计算。模拟结果表明,在20 dB的信噪比(SNR)下,20个路径通道内的30个用户设备(UE)的识别精度达到96.13%。此外,我们使用Roofline模型评估理论延迟,导致0.491 ms的空中接口延迟,满足超可靠和低延迟通信(URLLC)延迟要求。

密码学与安全

通过梯度引导的条件扩散模型从噪声扰动梯度增强隐私泄漏

联合学习通过梯度传输和聚合同步模型。然而,这些梯度会带来严重的隐私风险,因为敏感的训练数据嵌入其中。当梯度受到噪声干扰时,现有的梯度反转攻击会遭受显着退化的重建性能 - 一种常见的防御机制。在本文中,我们介绍了梯度引导条件扩散模型(GG-CDM),用于从泄漏的梯度重建私有图像,而无需事先了解目标数据分布。我们的方法利用扩散模型固有的去噪能力来规避噪声扰动提供的部分保护,从而提高了这种防御下的攻击性能。我们进一步提供了对重建误差边界和攻击损失收敛特性的理论分析,表征了关键因素(如噪声量级和攻击模型架构重建质量)的影响。广泛的实验证明了我们的攻击与高斯噪声扰动梯度的卓越重建性能,并证实了我们的理论发现。

密码学与安全

iSeal:加密指纹,实现可靠的LLM所有权验证

鉴于大型语言模型(LLM)培训的成本很高,保护LLM知识产权(IP)变得越来越重要。作为IP所有权验证的标准范式,LLM指纹识别在应对这一挑战方面起着至关重要的作用。现有的LLM指纹识别方法通过提取或注入特定于模型的特征来验证所有权。然而,他们在验证过程中忽略了潜在的攻击,当模型窃贼完全控制LLM的推理过程时,它们就会失效。在这种情况下,攻击者可能会共享提示响应对,使指纹无法学习或操纵输出以逃避精确匹配验证。我们提出了iSeal,这是第一个用于可靠验证的指纹识别方法,当模型窃贼以端到端的方式控制可疑的LLM时。它为模型和外部模块注入了独特的功能,并通过纠错机制和基于相似性的验证策略来加强。这些组件具有抵抗验证时间攻击的能力,包括基于串通的指纹取消学习和响应操作,同时具有理论分析和经验结果。iSeal在12个LLM上达到100%的指纹成功率(FSR),抵御10次以上的攻击,而基线在未学习和响应操作下失败。

密码学与安全人工智能

智能载波分配:自适应多模态Steganography的跨模式推理框架

在当今的数字世界中,它有许多不同类型的媒体,steganography,秘密通信的艺术,有很多问题要处理。传统方法通常是固定的,并且仅与一种类型的载体媒体一起工作。这意味着他们与那里的所有不同类型的媒体都相处不好。这个系统不会向“弱”或易于检测的载体发送数据,因为它无法适应。这使得系统不那么安全,一般也不那么秘密。本文提出了基于跨模式推理(CMR)引擎的新型智能运营商分配框架。这个引擎着眼于广泛的载体,如图像,音频和文本,看看它们是否适合steganography。它使用重要的测量,如熵,信号复杂性和词汇丰富性,为每个模式得出一个单一的可靠性得分。该框架使用这些分数来公平和智能地共享秘密比特流,为被认为更强大和更复杂的运营商提供更多数据。这种适应性分配策略使系统尽可能难以找到,并且尽可能强大地对抗Steganalysis。我们证明,与静态、非自适应的多模态技术相比,这种基于推理的方法在数据保护方面更安全、更优越。这使得建立更强大、更智能的秘密通信系统成为可能。

密码学与安全多媒体

QLCoder:用于安全漏洞静态分析的查询合成器

静态分析工具提供了一种强大的手段,通过指定编码易受攻击的代码模式的查询来检测安全漏洞。然而,编写此类查询具有挑战性,需要在安全和程序分析方面具有多种专业知识。为了应对这一挑战,我们展示了QLCoder - 一个代理框架,它自动合成CodeQL中的查询,CodeQL是一个强大的静态分析引擎,直接从给定的CVE元数据。 QLCode将LLM嵌入到具有执行反馈的合成循环中,同时使用自定义MCP接口限制其推理,该接口允许与语言服务器协议(用于语法指导)和RAG数据库(用于查询和文档的语义检索)进行结构化交互。这种方法允许QLCoder生成语法和语义上有效的安全查询。我们在 111 个 Java 项目中对 176 个现有 CVE 进行 QLCode 评估。基于 Claude Code 代理框架,QLCoder 综合了正确的查询,检测易受攻击的 CVE ,但在 53.4% 的 CVE 的修补版本中检测 CVE。相比之下,仅使用克劳德代码可以合成10%的正确查询。

密码学与安全编程语言软件工程

KG-DF:基于知识图谱的黑箱防御框架,防止越狱攻击

随着大型语言模型(LLM)在各个领域的广泛应用,它们面临的安全挑战变得越来越突出,尤其是越狱问题。这些攻击诱使模型通过精心制作的输入产生错误或不受控制的输出,威胁到模型的通用性和安全性。虽然现有的防御方法已经显示出一些有效性,但它们往往难以在模型通用性和安全之间取得平衡。过度防御可能会限制模型的正常使用,而防御不足可能会导致安全漏洞。针对此问题,我们提出了知识图谱防御框架(KG-DF)。具体来说,由于其结构化的知识表示和语义关联能力,可以通过将输入内容与知识库中的安全知识关联起来进行搜索,从而识别潜在的有害意图并提供安全的推理路径。然而,传统的KG方法在关键字提取方面遇到了重大挑战,特别是在面临多样化和不断发展的攻击策略时。为了解决这个问题,我们引入了一个可扩展的语义解析模块,其核心任务是将输入查询转换为一组结构化和安全的概念表示,从而增强匹配过程的相关性。实验结果表明,我们的框架增强了针对各种越狱攻击方法的防御性能,同时还通过整合领域一般知识来提高LLM在一般QA场景中的响应质量。

密码学与安全人工智能

通过邻里梯度信息提高对抗性转移性

众所周知,深度神经网络(DNN)容易受到对抗性例子的影响,导致性能显着下降。在黑箱攻击场景中,代理模型和目标模型之间的相当大的攻击性能差距持续存在。这项工作的重点是加强对抗性示例的可转移性,以缩小这种性能差距。我们观察到,围绕干净图像的梯度信息,即邻里梯度信息(NGI ) , 可以提供高可转移性。基于此见解,我们介绍了NGI-Attack,纳入了示例回溯和Multiplex Mask策略,以利用此梯度信息并增强可转移性。具体来说,我们首先采用示例回溯来积累邻里梯度信息作为初始动量术语。然后,我们使用Multiplex Mask来形成多向攻击策略,迫使网络专注于非判区,这些区域可以在几次迭代期间获得更丰富的梯度信息。广泛的实验表明,我们的方法显著增强了对抗性转移性。特别是,在攻击众多防御模型时,我们的平均攻击成功率达到95.2%。值得注意的是,我们的方法可以与任何现成的算法无缝集成,增强其攻击性能,而不会产生额外的时间成本。

计算机视觉与模式识别密码学与安全

一个签名,多笔付款:揭开和检测智能合约中签名重放漏洞

智能合约具有显着先进的区块链技术,数字签名对于可靠验证合同权限至关重要。通过签名验证,智能合约可以确保签名者拥有所需的权限,从而增强安全性和可扩展性。然而,缺乏对签名使用条件的检查会导致重复验证,增加许可滥用和威胁合同资产的风险。我们将此问题定义为 Signature Replay Vulnerability (SRV)。在本文中,我们进行了第一个实证研究,以调查SRV的原因和特征。从37家区块链安全公司的1,419份审计报告中,我们确定了108份详细的SRV描述和分类的五种SRV。为了自动检测这些漏洞,我们设计了LASiR,它利用大型语言模型(LLM)的一般语义理解能力,协助对签名状态进行静态污点分析,并识别签名重用行为。它还通过符号执行实现路径可访问性验证,以确保有效和可靠的检测。为了评估LASiR的性能,我们对涉及签名验证的15,383份合同进行了大规模实验,这些合同从四个区块链的918,964合同的初始数据集中选出:以太坊,币安智能链,Polygon和Arbitrum。结果表明,SRV很普遍,受影响的合同持有476万活跃资产。其中,19.63%在以太坊上使用签名的合同包含SRV。此外,手动验证表明,LASiR的检测成绩为87.90%。消融研究和比较实验表明,LLM提供的语义信息有助于静态污渍分析,显著增强LASiR的检测性能。

密码学与安全软件工程

DeepTracer:通过Deep Coupled Watermarks追踪被盗模型

模型水印技术可以通过构建特定的输入输出对将水印信息嵌入到受保护模型中的所有权声明。然而,在面对模型窃取攻击时,现有的水印很容易被删除,并使模型所有者难以有效地验证被盗模型的版权。在本文中,我们分析了当前水印方法在模型窃取场景下失败的根本原因,然后探索潜在的解决方案。具体来说,我们引入了一个健壮的水印框架,DeepTracer,它利用了一种新的水印样品构建方法和同级耦合损耗约束。 DeepTracer可以在水印任务和主要任务之间产生高耦合模型,这使得对手在窃取主要任务功能时不可避免地学习隐藏的水印任务。此外,我们提出了有效的水印样品过滤机制,精心选择模型所有权验证中使用的水印关键样品,以提高水印的可靠性。跨多个数据集和模型的广泛实验表明,我们的方法超越了防御各种模型窃取攻击以及水印攻击的现有方法,并实现了新的最先进的有效性和鲁棒性。

密码学与安全机器学习

攻击中心设计:智能合同漏洞的程序结构分类

智能合约将高价值资产和复杂逻辑集中在小型、不可变的程序中,即使是很小的错误也会导致重大损失。现有的分类和工具仍然支离破碎,围绕诸如再进入而不是结构原因等症状组织。本文介绍了以攻击为中心的程序结构分类法,将 Solidity 漏洞统一为 8 个根因家族,涵盖控制流、外部调用、状态完整性、算术安全性、环境依赖性、访问控制、输入验证和跨域协议假设。每个家族都通过简洁的 Solidity 示例、利用机制和缓解来说明,并与静态、动态和基于学习的工具可观察到的检测信号相关联。我们进一步将遗留数据集(SmartBugs,SolidiFI)交叉映射到此分类法中,以揭示标签漂移和覆盖差距。分类学提供了一个一致的词汇和实用的清单,为研究人员和从业者提供了更可解释的检测,可重复的审计和结构化的安全教育。

密码学与安全分布式、并行与集群计算

MULTI-LF:多环境网络中实时恶意交通检测的连续学习框架

多环境(M-En)网络集成了多种流量来源,包括物联网(IoT)和传统计算系统,为恶意流量检测创造了复杂且不断变化的条件。现有的基于机器学习(ML)的方法,通常在静态单域数据集上训练,通常无法跨异构网络环境进行推广。为了解决这一差距,我们开发了一个基于Docker-NS3的基于实际的测试平台,该测试平台可以模拟物联网和传统流量条件,从而实现实时标记网络流的生成和捕获。生成的M-En数据集将这种流量与策划的公共PCAP跟踪相结合,以提供良性和恶意行为的全面覆盖。在这一基础上,我们提出了Multi-LF,一个实时持续学习框架,将轻量级模型(M1)与更深层模型(M2)相结合,以实现高置信度的改进和适应。基于信任的协调机制可以在不影响准确性的情况下提高效率,而重量插值可减轻持续更新期间的灾难性遗忘。以1秒间隔提取的特征捕获细粒度的时间模式,从而能够早期识别不断变化的攻击行为。在实时流量的Docker-NS3测试平台中实施和评估,Multi-LF实现了0.999的精度,同时只需要0.0026%的数据包进行人为干预,证明了其在异构网络环境中实时恶意流量检测的有效性和实用性。

密码学与安全人工智能机器学习

Siren:基于学习的多转攻击框架,用于模拟现实世界的人类越狱行为

大型语言模型(LLM)广泛应用于现实世界的应用,引发了人们对其安全性和可信度的担忧。虽然与越狱的红色合作暴露了 LLM 的脆弱性,但目前的努力主要集中在单轮攻击上,忽视了现实世界的对手所使用的多轮策略。现有的多转弯方法依赖于静态模式或预定义的逻辑链,没有考虑到攻击期间的动态策略。我们建议使用Siren,一个基于学习的多转弯攻击框架,旨在模拟现实世界的人类越狱行为。 Siren包括三个阶段:(1)MiniMax驱动的训练集结构利用回合级LLM反馈,(2)训练后攻击者进行监督微调(SFT)和直接偏好优化(DPO),(3)攻击和目标LLM之间的相互作用。实验证明,Siren以LLaMA-3-8B为目标模型,以针对Gemini-1.5-Pro的攻击者实现了90%的攻击成功率(ASR),70%的Mistral-7B对GPT-4o的攻击成功率(ASR),明显优于单圈基线。此外,具有7B级模型的Siren实现了与利用GPT-4o作为攻击者的多回合基线相当的性能,同时需要更少的转弯,并采用与攻击目标更好地语义一致的分解策略。我们希望 Siren 能激发在现实情况下对先进的多轮越狱袭击进行更有力的防御。代码可在https://github.com/YyiyiZhao/iren查阅。警告:本文包含潜在的有害文本。

计算与语言人工智能密码学与安全

GraphFaaS:无服务器GNN推理,用于抗爆,实时入侵检测

基于Provenance的入侵检测是图形机器学习在网络安全中越来越流行的应用,其中系统活动被建模为出处图,以捕获潜在恶意行为之间的因果关系和相关性。图形神经网络(GNN)在这种设置中表现出强劲的表现。然而,传统的静态提供的GNN推理架构在满足入侵检测的两个关键需求方面不足:(1)保持持续的低检测延迟,(2)处理高度不规则且突发性工作负载。为了全面应对这些挑战,我们提出了GraphFaaS,这是一种为基于GNN的入侵检测量身定制的无服务器架构。 GraphFaaS 利用无服务器计算的弹性和敏捷性来动态扩展 GNN 推理管道。我们将 GNN 工作流并行化并适应无服务器环境,确保系统能够实时响应波动的工作负载。通过将计算资源与静态配置相解,GraphFaaS提供稳定的推理延迟,这对于网络安全操作中的可靠入侵检测和及时的事件响应至关重要。初步评估显示,GraphFaaS与基线相比,将平均检测延迟降低了85%,变异系数(CV)降低了64%。

密码学与安全

SALT:在思想链中转向无泄漏思维的主动

随着大型语言模型(LLM)发展成为可以访问敏感用户数据的个人助理,他们面临着一个关键的隐私挑战:虽然之前的工作已经解决了输出级隐私问题,但最近的调查结果显示,LLM经常通过其内部推理过程泄露私人信息,违反了上下文隐私期望。当模型无意中在其推理痕迹中暴露敏感细节时,即使最终输出看起来安全时,也会发生这些泄漏的想法。挑战在于防止这种泄漏,而不损害模型的推理能力,需要在隐私和效用之间实现微妙的平衡。我们引入了转向无泄漏思维(SALT)的转向激活,这是一种轻量级的测试时间干预,通过将有针对性的转向向量注入隐藏状态来缓解模型思维链(CoT)中的隐私泄漏。我们确定了导致这种行为的高泄漏层。通过跨多个LLM的实验,我们证明SALT实现了减少,包括QwQ-32B的CPL减少18.2%,Llama-3.1-8B的CPL减少17.9%,Deepseek在上下文隐私泄漏数据集AirGapAgent-R中减少31.2%,同时保持可比的任务性能和实用性。我们的工作将SALT确立为具有推理能力的语言模型中测试时间隐私保护的实用方法,为更安全地部署基于LLM的个人代理提供了途径。

密码学与安全人工智能计算与语言机器学习

从LLM到代理:安全补丁检测中基于LLM和LLM的代理的比较评估

开源软件(OSS)的广泛采用加速了软件创新,但也增加了由于漏洞的快速传播和无声补丁发布而增加了安全风险。近年来,大型语言模型(LLM)和基于LLM的代理在各种软件工程(SE)任务中表现出显着的能力,使他们能够有效地应对漏洞检测等软件安全挑战。然而,对LLM和基于LLM的代理在安全补丁检测方面的能力的系统评估仍然有限。为了弥补这一差距,我们对 LLM 和基于 LLM 的代理的性能进行了全面的评估,用于安全补丁检测。具体来说,我们研究三种方法:Plain LLM(具有系统提示的单个LLM),Data-Aug LLM(基于Plain LLM的数据增强)和ReAct Agent(利用思想作用观察机制)。我们还根据这些方法评估商业和开源LLM的性能,并将这些结果与现有基线的结果进行比较。此外,我们分析了这些方法在各种漏洞类型的检测性能,并检查了不同提示策略和上下文窗口大小对结果的影响。我们的研究结果表明,Data-Aug LLM取得了最佳的整体性能,而ReAct Agent则展示了最低的误报率(FPR)。虽然基线方法表现出很强的准确性,但它们的假阳性率明显更高。相比之下,我们评估的方法实现了可比的准确性,同时大大减少了FPR。这些发现为LLM和基于LLM的代理在安全补丁检测中的实际应用提供了宝贵的见解,突出了他们在保持稳健性能的同时最大限度地减少误报率方面的优势。

密码学与安全软件工程

使用同态加密进行区块链集成隐私保护医疗保险索赔处理

这项研究提出了一个分散和加密安全的框架,以解决医疗保险索赔处理生态系统中最严重的隐私,数据安全和保护问题。该研究的范围侧重于以透明,隐私保护的方式管理保险索赔,同时保持患者,医疗保健提供者和保险公司所需的效率和信任水平。为了实现这一目标,拟议的系统增加了区块链技术,以提供一个不可更改的,分散的和可审计的索赔交易分类账,从而增强了与索赔相关的整体流程和所有利益相关者之间的信任。为了保护关键患者信息,该框架采用同态加密现代形式的密码学,允许授权的保险提供商执行必要的操作,如索赔裁决和在加密医疗记录上报销,在此过程中没有任何解密。这种方法可显著降低第三方处理隐私风险,因为即使完成第三方处理,患者数据也可以保密。此外,智能合约提高了索赔处理管道中最重要的程序的自动化,从而降低了手动,操作和对人类错误或欺骗行为的易感性。这两种变革性技术的集成区块链和同态加密代表了这项工作的核心贡献,使透明度和隐私共存,这些通常被视为传统系统中的竞争目标。因此,这些技术有望促进创建可靠,有效和隐私保护架构,可以改变医疗索赔提交系统范式。

密码学与安全

合作本地差分隐私:在分布式环境中保护时间序列数据

手机、可穿戴设备、物联网传感器和联网车辆等智能设备的快速增长导致连续时间序列数据的爆炸式增长,这些数据在医疗保健、交通等方面提供了宝贵的见解。然而,这种激增引起了重大的隐私问题,因为敏感的模式可以揭示个人细节。虽然传统的差分隐私(DP)依赖于受信任的服务器,但本地差分隐私(LDP)使用户能够扰乱自己的数据。然而,传统的LDP方法通过添加用户特定的噪声来扰动时间序列数据,但表现出漏洞。例如,在固定时间窗口中施加的噪声可以在聚合过程中取消(例如,平均),使对手能够随着时间的推移推断出个人统计数据,从而侵蚀隐私保证。为了解决这些问题,我们引入了合作本地差分隐私(CLDP)机制,通过在多个用户之间分发噪声向量来增强隐私。在我们的方法中,噪声是协同生成和分配的,因此当所有用户的扰动数据被聚合时,噪声会抵消保护整体统计属性,同时保护个人隐私。这种合作策略不仅可以对抗基于时间窗口的方法固有的漏洞,而且还可以有效地扩展大型实时数据集,从而在多用户环境中的数据效用和隐私之间取得更好的平衡。

密码学与安全

AdaptDel: 适应删除率随机平滑认证稳健性

我们考虑了基于编辑距离扰动的序列分类的认证稳健性问题。自然出现的不同长度的输入(例如,自然语言处理任务中的句子)对采用固定率删除机制并导致性能欠优的当前方法提出了挑战。为此,我们引入了具有可适应删除速率的AdaptDel方法,可以根据输入属性动态调整。我们将随机平滑的理论框架扩展到可变速率删除,确保有关编辑距离的声音认证。我们在自然语言任务中取得了强大的经验成果,与最先进的认证相比,观察到认证区域的中位基数提高了30个数量级。

计算与语言密码学与安全机器学习

继续滚动加载更多