Skip to content

书 · AI Agent

从对话到行动——当 AI 不再只是回答问题,而是能自主规划、使用工具、完成任务时,一个新的计算范式正在诞生。

待完善

本章节尚待撰写,欢迎参与贡献

大纲

一、什么是 AI Agent

  • 核心定义:能够感知环境、自主决策、采取行动以实现目标的 AI 系统
  • 与传统 AI 助手的区别:对话式 AI 等你提问,Agent 主动解决问题
  • Agent = LLM + 记忆 + 工具调用 + 规划能力

二、思想源头

  • 早期智能体研究:BDI(信念-愿望-意图)架构
  • 强化学习中的 Agent:在环境中通过试错学习
  • 软件 Agent 与多智能体系统(1990s-2000s)
  • 为什么 LLM 让 Agent 重新成为可能:通用语言理解 + 推理 + 代码生成

三、工具使用与函数调用

  • Toolformer(Meta, 2023):让模型学会调用外部工具
  • ChatGPT Plugins(2023):OpenAI 的第一次 Agent 尝试
  • Function Calling:API 层面的工具调用标准化
  • MCP(Model Context Protocol, Anthropic):Agent 连接外部数据源的开放协议

四、自主 Agent 框架

  • AutoGPT(2023.3):第一个爆火的自主 Agent 项目,GitHub 星标 15 万+
  • BabyAGI:极简的任务规划 Agent
  • LangChain / LangGraph:Agent 开发框架
  • CrewAI:多 Agent 协作框架
  • 从爆火到冷静:早期 Agent 的可靠性问题

五、编程 Agent

  • GitHub Copilot(2021):AI 辅助编程的起点
  • Cursor:AI 原生的代码编辑器
  • Claude Code(Anthropic):终端中的 AI 编程助手
  • Devin(Cognition, 2024):号称"第一个 AI 软件工程师"
  • OpenAI Codex Agent、Google Jules
  • 编程 Agent 的演进:从补全代码到自主开发

六、多 Agent 系统

  • 多 Agent 协作:让多个专业化 Agent 分工合作
  • Agent 社会模拟:斯坦福"小镇"实验(Generative Agents, 2023)
  • 辩论与对抗:多个 Agent 通过辩论提高输出质量
  • Agent-to-Agent 通信协议的探索

七、企业级 Agent

  • Salesforce Agentforce:CRM 领域的 AI Agent
  • 各行业的 Agent 应用:客服、数据分析、运营自动化
  • RPA + LLM:从规则自动化到智能自动化
  • Agent 的可靠性挑战:企业级场景对错误零容忍

八、中国 AI Agent 生态

  • 扣子(Coze,字节跳动):低代码 Agent 构建平台
  • 百度文心智能体平台
  • 阿里百炼
  • Dify:开源的 LLM 应用开发平台
  • 中国 Agent 生态的特点:平台化、小程序化

九、Agent 的未来与风险

  • Agent 的自主性边界:应该给 AI Agent 多大的决策权?
  • 安全问题:prompt 注入攻击、Agent 被劫持
  • 经济影响:Agent 会取代多少白领工作?
  • 通往 AGI 的路径?Agent 是否是实现通用智能的关键拼图

参考资料

待补充