钓鱼邮件生成

风险概览

风险编号：GAARM.0031.002
风险归属：GAARM.0031
安全阶段：模型安全
生命周期：应用阶段
创建时间：2024.05.01
修改时间：2024.05.01

攻击概述¶

钓鱼邮件是一种欺诈性邮件，攻击者可以通过特殊的手段，如精心构造提示输入、通过API绕过安全限制等，诱导LLM生成钓鱼邮件。通过将其伪装成合法的通信，诱使模型泄露敏感信息，如登录凭证、内部数据等。一旦这些信息被恶意获取，可能导致大模型的安全性受到威胁，进而影响到使用该模型的用户的隐私和数据安全。

案例一：如图WormGPT被要求制作一封电子邮件

目标是对一个不设防的账户经理施加压力，迫使其支付虚假发票。

案例二 本文介绍了生成式AI对恶意工具的生成和应用。攻击者指示 AI 将恶意 URL 嵌入到代码中，当用户打开如 Excel 这样的文件时，系统会自动下载并执行恶意软件，进而带来安全风险

案例三 本文发现网络犯罪分子可以轻松地绕过OpenAI的保护措施，例如将自己定位为研究人员，以此掩盖他们的恶意意图，进而让LLM生成恶意钓鱼邮件，带来不良后果

缓解方式	描述
输入/输出内容验证	通过算法或人工检查机制，识别和拦截生成的内容中可能包含的恶意或诱导性信息
AI检测工具	使用如M01系统等AI工具提高钓鱼邮件的检测率
安全意识培训	提高用户对钓鱼邮件的警觉性，教育他们识别可疑邮件的特征，如拼写错误、不寻常的语法、紧迫性的制造等