书 · AI Agent

从对话到行动——当 AI 不再只是回答问题，而是能自主规划、使用工具、完成任务时，一个新的计算范式正在诞生。

待完善

本章节尚待撰写，欢迎参与贡献。

大纲

一、什么是 AI Agent

核心定义：能够感知环境、自主决策、采取行动以实现目标的 AI 系统
与传统 AI 助手的区别：对话式 AI 等你提问，Agent 主动解决问题
Agent = LLM + 记忆 + 工具调用 + 规划能力

二、思想源头

早期智能体研究：BDI（信念-愿望-意图）架构
强化学习中的 Agent：在环境中通过试错学习
软件 Agent 与多智能体系统（1990s-2000s）
为什么 LLM 让 Agent 重新成为可能：通用语言理解 + 推理 + 代码生成

三、工具使用与函数调用

Toolformer（Meta, 2023）：让模型学会调用外部工具
ChatGPT Plugins（2023）：OpenAI 的第一次 Agent 尝试
Function Calling：API 层面的工具调用标准化
MCP（Model Context Protocol, Anthropic）：Agent 连接外部数据源的开放协议

四、自主 Agent 框架

AutoGPT（2023.3）：第一个爆火的自主 Agent 项目，GitHub 星标 15 万+
BabyAGI：极简的任务规划 Agent
LangChain / LangGraph：Agent 开发框架
CrewAI：多 Agent 协作框架
从爆火到冷静：早期 Agent 的可靠性问题

五、编程 Agent

GitHub Copilot（2021）：AI 辅助编程的起点
Cursor：AI 原生的代码编辑器
Claude Code（Anthropic）：终端中的 AI 编程助手
Devin（Cognition, 2024）：号称"第一个 AI 软件工程师"
OpenAI Codex Agent、Google Jules
编程 Agent 的演进：从补全代码到自主开发

六、多 Agent 系统

多 Agent 协作：让多个专业化 Agent 分工合作
Agent 社会模拟：斯坦福"小镇"实验（Generative Agents, 2023）
辩论与对抗：多个 Agent 通过辩论提高输出质量
Agent-to-Agent 通信协议的探索

七、企业级 Agent

Salesforce Agentforce：CRM 领域的 AI Agent
各行业的 Agent 应用：客服、数据分析、运营自动化
RPA + LLM：从规则自动化到智能自动化
Agent 的可靠性挑战：企业级场景对错误零容忍

八、中国 AI Agent 生态

扣子（Coze，字节跳动）：低代码 Agent 构建平台
百度文心智能体平台
阿里百炼
Dify：开源的 LLM 应用开发平台
中国 Agent 生态的特点：平台化、小程序化

九、Agent 的未来与风险

Agent 的自主性边界：应该给 AI Agent 多大的决策权？
安全问题：prompt 注入攻击、Agent 被劫持
经济影响：Agent 会取代多少白领工作？
通往 AGI 的路径？Agent 是否是实现通用智能的关键拼图

参考资料

待补充