关于智能体的实验 0 - 学术文献阅读理解

Table of Contents

本文记录我在尝试构建智能体和多智能体系统的过程，探索其应用潜力。这会是一个系列文章，这一章节关注的是智能体的构建与多智能体动态交互行为的实现。最后会给出各类学术文章生成的报告示例。

前情

智能体发展迅速，但我对它的了解只停留在各种名词和概念的层面，于是想通过实际动手构建一些智能体系统来加深理解。

之前使用 Cherry Studio 结合个人知识库 MCP 工具实现的一个文章理解的助手：文本从 PDF 中提取出来后，结合包含理解文章和生成报告任务的提示词发送给API，最终 LLM 调用 MCP 工具生成报告储存在知识库中。

现在的模型 API，上下文窗口已经足够大，大多情况下可以直接将全文内容发送给模型进行理解。结果就是还不错的文章报告效果。我想以此为起点，我想试试设计不同的智能体和多智能体交互行为，实现读论文这个任务上多样的需求：

为了挑选合适的工具，我去 Reddit 搜索了大家都在用什么工具，发现下面这些项目比较流行：

我最后选用了 PydanticAI，主要是看中他数据模型定义和验证的能力。另外，PydanticAI 并没有封装太多智能体的行为逻辑，更多是提供一个工具库，方便我自己设计智能体和多智能体交互的流程。

本任务目标是让一个或多个智能体对学术论文进行结构化理解，生成人类可读的报告。

输出为 Markdown 格式的纯文本报告，不限定格式，只在提示词中给出结构建议（如多使用标题、列表、引用等 Markdown 语法，提升可读性）。

这个系列文章预计会有四个部分：

敬请期待！

Author	Zhenghao Wu
Publish & Update Date	2025-12-03
Tags	AI Agentic AI Multi-agent Systems Literature Review Academic Paper Research Reading 人工智能智能体多智能体系统文献综述学术论文研究阅读 Agentic Reading Academic Literature 文献理解论文阅读