喵学堂喵学堂
AI Agent 工程师

AI Agent 工程师·核心技能

从工作流到多智能体,再到成本/延迟工程,搞懂如何在不堆大模型的前提下把 agent 做快、做省。

单元 1
多智能体协作
把单 agent 拆成多 agent 的编排拓扑、适用边界,以及增益背后的成本与失败模式。
  1. 1多智能体协作:编排、增益与代价什么时候该上多 agent,什么时候纯属烧钱5
单元 2
成本 / 延迟工程
从推理的两段式机制出发,掌握 KV cache、prompt caching、投机解码、批处理、模型路由、提示压缩等省钱省时的工程杠杆。
  1. 1成本 / 延迟工程:把 agent 做快、做省别只想着换大模型——真正的杠杆在架构和推理细节里5