← 现代 AI 开发者
别让 AI 闯祸:测试与安全
你的 Agent 会读邮件、点链接、调工具、跑代码——能力越大,闯祸的口子也越多。本级别用最生活化的方式讲清楚:别人怎么用一句话骗你的 Agent(提示注入)、密钥为什么不能塞进提示里、为什么 AI 说“安全扫描通过”你也不能全信,以及如何用自动化测试加人工 review 给 AI 的产出兜底。学完你会建立一整套“别让 AI 闯祸”的防御直觉。
单元 1
给 AI 上保险
围绕 Agent 的四类典型风险——提示注入、密钥泄露与 SSRF、盲信 AI 的安全结论、产出无人兜底——逐个建立防御思路。