[toc]
AI Agent笔记

AI Agent 介绍
AI Agent(人工智能代理) 是一个能够感知环境、进行决策并执行行动,以达成特定目标的智能软件实体,它不仅仅是回答问题的聊天机器人,更是能够动手做事的智能执行者。
什么是 Agent?
AI Agent(人工智能代理)本质是自动执行任务的程序,核心在于让模型不只回答问题,而是按步骤完成动作。
AI Agent = LLM (大脑,大语言模型) + Planning (规划) + Tool use (工具使用) + Memory (记忆)。
- LLM (大脑,大语言模型): 作为核心推理机,负责理解意图、生成文本和进行逻辑判断。
- Planning (规划): 能够将复杂的目标(如"帮我解题")拆解成可执行的步骤。
- Memory (记忆): 记录对话历史(短期)和存储专业知识库(长期)。
- Tool Use (工具使用): 能够根据需求去查谷歌搜索、读数据库、甚至跑 Python 代码。

传统程序和 AI Agent 的区别
传统的软件程序遵循固定的指令流程:输入 → 处理 → 输出。
而AI Agent 则更像一个有自主性的员工,它能够:
- 理解任务目标:明白你想要什么结果
- 制定计划:思考如何达成目标
- 使用工具:调用各种资源和 API 执行任务
- 自我调整:根据反馈优化策略
- 持续执行:直到完成任务或遇到无法解决的问题
传统AI模型和AI Agent的区别
AI Agent 本身是在传统AI模型的基础上,加入了规划、记忆和工具使用等功能,使得它能够更智能、更灵活地完成任务。
| 维度 | 传统 AI 模型 | AI Agent |
|---|---|---|
| 交互方式 | 单次输入输出 | 多轮对话、持续交互 |
| 决策能力 | 基于输入直接推理 | 规划、反思、迭代优化 |
| 工具使用 | 无法主动调用外部工具 | 可调用搜索、计算器、API 等 |
| 记忆机制 | 仅限当前上下文 | 短期+长期记忆 |
| 目标导向 | 完成单一预测任务 | 完成复杂目标 |
| 错误处理 | 输出即结束 | 可自我纠错、重试 |
AI Agent 的发展历程

