凭记忆答 vs 开卷答
AI 脑子里装了海量知识,但它的记忆是模糊且会过期的——尤其是你公司内部的资料、最新的数据,它压根没学过。硬要它答,就只能凭印象瞎编。
RAG 三步:找 → 塞 → 答
RAG(检索增强生成)听着玄,拆开就三步:
1. 找:根据你的问题,从资料库里搜出最相关的几段。
2. 塞:把这几段塞进上下文(摆到 AI 桌面上)。
3. 答:让 AI 基于这几段资料来回答。
def answer_with_rag(question):
docs = search(question) # 1. 找:搜出相关资料
context = "\n".join(docs) # 2. 塞:拼进上下文
prompt = f"参考资料:\n{context}\n\n问题:{question}"
return llm(prompt) # 3. 答:基于资料回答为什么 RAG 能少瞎编
AI 瞎编(专业叫幻觉),常常是因为它桌上没有答案,又被逼着必须说点什么。
一句话:RAG 不是让 AI 更聪明,而是让它先看到答案,再开口。
自测 · 学完检查一下
想真正动手做题、记进度、攒连胜?到互动课里练。
RAG 把 AI 答题从“闭卷”变成了什么?
答案:开卷考试:先查资料再回答
RAG 的核心就是先检索出相关资料、摆到上下文里,再让 AI 照着答,正如开卷考试。
RAG 三步可以记成:找 → ___ → 答(把搜到的资料拼进上下文)。
答案:塞
中间一步是“塞”:把检索到的相关资料拼进上下文、摆到 AI 桌面上,它才看得到。
判断:问“我们公司的退货政策具体怎么规定?”这种依赖内部资料的问题,适合用 RAG 先查再答。
答案:对
内部规定、最新数据这类模型没学过的内容,必须先检索真实资料喂进去,否则它只能瞎编。
下面哪个问题最不需要 RAG(凭模型自身常识就能答好)?
答案:把这段中文翻译成英文
翻译靠的是模型本身的通用能力,不依赖外部最新资料;其余几个都依赖只有查资料才知道的内部/最新信息。
AI 在没有依据时硬编出看似可信的答案,这种现象专业上叫“___”。
答案:幻觉
“幻觉”指模型一本正经地编造内容。RAG 通过先提供真实资料,让它有据可依,从而减少幻觉。
判断:RAG 的本质是把模型变得更聪明,而不是给它提供资料。
答案:错
RAG 不改变模型本身,它只是“让 AI 先看到答案再开口”——通过提供真实资料来减少瞎编。