从“点外卖”说起
你饿了,对一个很能干的助理说一句:“随便点份不辣的午饭,预算 40。”
他自己打开外卖 App、筛选、下单、付钱,最后告诉你“30 分钟后送到”。你只说了目标,没说每一步怎么做。
那它和 ChatGPT 有什么区别?
普通的大模型(LLM)像一个只会动嘴的天才:你问它“怎么点外卖”,它能说得头头是道,但它不会真的去下单。
Agent = 大模型(脑子)+ 一双手(工具)+ 一个循环(能多走几步)。它不只是回答你,它能真的去做。
LLM: 你问 → 它答(一次性,只动嘴)
Agent:你给目标 → 想 → 动手用工具 → 看结果 → 再想 → ……→ 交付拆开看,就三个零件
别把 Agent 想得太玄,它就三块:
脑子 = 大模型,负责想;手 = 工具(一个个函数),负责做;循环 = 让它能根据结果再想再做,直到完成。
自测 · 学完检查一下
想真正动手做题、记进度、攒连胜?到互动课里练。
在“点外卖”的例子里,最能体现 Agent 特点的是哪一句?
答案:你只给了目标,剩下的步骤它自己搞定
Agent 的精髓就是:你给目标,它自己拆步骤、动手、交付。
下面哪个最接近 Agent 和普通大模型(LLM)的区别?
答案:Agent 会真的调用工具去完成任务,LLM 通常只输出文字
关键差别是“会不会动手”:Agent = 大模型 + 工具 + 循环,能真的执行;LLM 默认只产出文字。
一句话总结:Agent = 大模型(脑子)+ 工具(手)+ ___(能多走几步)。
答案:循环
正是“循环”让它能:想→做→看结果→再想,而不是只答一次。
判断:一个助手能滔滔不绝地告诉你“怎么订机票”,但它没法真的去订——它算 Agent 吗?
答案:不算
只会动嘴、没有“手”去真的执行,那还是个 LLM,不是 Agent。
下面哪个场景里的“它”才算一个 Agent?
答案:它真的去查了数据库,把昨天的下单量返回给你
真的动手用工具拿到结果,才是 Agent;其余都只是“动嘴”。
和 Agent 打交道时,你给它的是 ___,而不是每一步具体操作。
答案:目标
给目标、不给步骤——步骤是它自己想的。下一课就看它怎么“想”。