书 · AI Agent
从对话到行动——当 AI 不再只是回答问题,而是能自主规划、使用工具、完成任务时,一个新的计算范式正在诞生。
待完善
本章节尚待撰写,欢迎参与贡献。
大纲
一、什么是 AI Agent
- 核心定义:能够感知环境、自主决策、采取行动以实现目标的 AI 系统
- 与传统 AI 助手的区别:对话式 AI 等你提问,Agent 主动解决问题
- Agent = LLM + 记忆 + 工具调用 + 规划能力
二、思想源头
- 早期智能体研究:BDI(信念-愿望-意图)架构
- 强化学习中的 Agent:在环境中通过试错学习
- 软件 Agent 与多智能体系统(1990s-2000s)
- 为什么 LLM 让 Agent 重新成为可能:通用语言理解 + 推理 + 代码生成
三、工具使用与函数调用
- Toolformer(Meta, 2023):让模型学会调用外部工具
- ChatGPT Plugins(2023):OpenAI 的第一次 Agent 尝试
- Function Calling:API 层面的工具调用标准化
- MCP(Model Context Protocol, Anthropic):Agent 连接外部数据源的开放协议
四、自主 Agent 框架
- AutoGPT(2023.3):第一个爆火的自主 Agent 项目,GitHub 星标 15 万+
- BabyAGI:极简的任务规划 Agent
- LangChain / LangGraph:Agent 开发框架
- CrewAI:多 Agent 协作框架
- 从爆火到冷静:早期 Agent 的可靠性问题
五、编程 Agent
- GitHub Copilot(2021):AI 辅助编程的起点
- Cursor:AI 原生的代码编辑器
- Claude Code(Anthropic):终端中的 AI 编程助手
- Devin(Cognition, 2024):号称"第一个 AI 软件工程师"
- OpenAI Codex Agent、Google Jules
- 编程 Agent 的演进:从补全代码到自主开发
六、多 Agent 系统
- 多 Agent 协作:让多个专业化 Agent 分工合作
- Agent 社会模拟:斯坦福"小镇"实验(Generative Agents, 2023)
- 辩论与对抗:多个 Agent 通过辩论提高输出质量
- Agent-to-Agent 通信协议的探索
七、企业级 Agent
- Salesforce Agentforce:CRM 领域的 AI Agent
- 各行业的 Agent 应用:客服、数据分析、运营自动化
- RPA + LLM:从规则自动化到智能自动化
- Agent 的可靠性挑战:企业级场景对错误零容忍
八、中国 AI Agent 生态
- 扣子(Coze,字节跳动):低代码 Agent 构建平台
- 百度文心智能体平台
- 阿里百炼
- Dify:开源的 LLM 应用开发平台
- 中国 Agent 生态的特点:平台化、小程序化
九、Agent 的未来与风险
- Agent 的自主性边界:应该给 AI Agent 多大的决策权?
- 安全问题:prompt 注入攻击、Agent 被劫持
- 经济影响:Agent 会取代多少白领工作?
- 通往 AGI 的路径?Agent 是否是实现通用智能的关键拼图
参考资料
待补充