跳转至

级联幻觉攻击

风险概览

风险编号:GAARM.0065
子风险:无
安全阶段:数据安全
生命周期:应用阶段
创建时间:2025.12.10
修改时间:2025.12.10

攻击概述

级联幻觉攻击是一种针对多Agent共享记忆机制的高级攻击技术,攻击者通过向某个Agent注入错误或恶意信息,利用Agent间的记忆共享机制实现错误信息的级联传播和扩散。这种攻击的核心在于利用Agent间的信任关系和共享记忆的权限控制缺陷,通过初始注入、记忆共享、级联放大和持续污染等阶段,实现整个Agent网络的认知污染和数据投毒,可能导致分布式决策系统产生系统性错误,造成严重的业务损失和安全风险。

攻击案例

案例 描述
案例一 在 2025 年由 Atharv Singh Patlan 等研究者提出的 MURMUR 框架中,安全研究团队演示了所谓的 交叉用户污染(cross‑user poisoning)攻击,攻击者通过向多用户共享的 Agent 系统发送普通但精心设计的消息,成功污染了系统的共享状态。

攻击风险

  • 认知污染:整个Agent网络产生系统性错误认知
  • 决策质量下降:基于错误信息的集体决策质量严重下降
  • 系统可靠性受损:多Agent系统的可靠性和可信度严重下降
  • 业务连续性中断:错误的集体决策导致业务流程中断
  • 数据完整性破坏:共享记忆中的数据被恶意污染
  • 恢复成本高昂:污染后的系统恢复难度大、成本高

缓解措施

缓解方式 描述
信息验证机制 建立共享记忆信息的真实性验证机制,实施多Agent交叉验证,建立信息可信度评估体系
权限控制强化 实施细粒度的记忆共享权限控制,建立记忆访问审计机制,限制记忆修改权限范围
信息溯源系统 建立完整的共享信息溯源机制,实施信息传播路径追踪,建立信息来源可信度评估
异常检测系统 监控Agent网络的信息传播模式,检测异常的信息级联效应,建立污染攻击检测模型

参考