凤凰彩票APP 探索智能体工程的 5 个经验


客岁12月,我在玩 Ollama 和 Gemini API,试图创建一个能运行类似 DND(龙与地下城)翰墨冒险游戏的 Agent。我最终遗弃了,因为状态照应对 Ollama 来说太难了,以致对 Gemini 2.0-flash 来说也太繁难。我最终遗弃了创建一个可用的 DND 模拟器,转而作念了一个精真金不怕火的计数器,附带一个旁白来解释用户的更新操作。
在那次尝试限度时,我得出的论断是:
"让 LLM 更新状态,就好比让詹姆斯·乔伊斯帮你报税通常离谱。"
然则,在那之后的几个月里,我收回了我方说的话。Claude Code、OpenClaw 以及最近几个月透露的一系列 Agentic 程序,集体摇荡了通盘科技行业。我第一次使用 Claude Code 是在二月中旬,用来完成 BetaZero UI 的构建。其速率、体量和编码才能远远卓绝了我之前从 Agentic 编码用具中体验到的任何东西。
是以,带着这个布景……
名堂 1:James Joyce,税务助手
https://github.com/EvanMcCormick37/mvp-james-joyce
这是我要谈到的名堂中的第一个。我用了 2 天时辰完成了它,作为丹佛一家公司第三轮口试的作品(我走收场沿途四轮口试,但缺憾地未能赢得实习契机)。

我花了约略一个小时详情了滥觞的见地。一个能带领你了解税务景色、帮你列出可能有经验赢得的扣除项的 Agent,同期还会构建一个行动遐想,匡助你赢得最大可能的税务扣除。
经验 1:快速迭代,手动测试
当我滥觞有这个念念法时,职责流看起来与上头的图表整个不同。我滥觞设念念模子是一个 Agentic Graph-RAG 问答系统,使用基于当年官方 IRS 出书物构建的学问图谱和向量数据库。我念念象用户提倡一个问题,模子提供一个班班可考、带来源的谜底,同期附带 1-2 个关系问题,匡助详情用户的扣除经验。
我接洽了架构,草拟了一份 ARCHITECTURE.md,然后用 Claude Code 在不到一小时的时辰内完成了一次 one-shot 构建。
但当我现实使用这个诓骗时,嗅觉有些区别劲……
问题出在问答职责流上。用户的每条推崇和问题齐会收到一大段翰墨复兴,末尾附带一个计划财务历史中某个立地方面的问题。这既不是优雅的对话,也不是省俭时辰的诓骗。事实诠释,模范的 RAG 文档问答职责流在这个用例中根底行欠亨。
于是我尝试了别的门径。我径直和 Gemini 聊了聊我可能赢得的扣除项,然后念念象怎样检阅这个体验。

在原始基础模子上测试职责流。
Gemini 的刚硬在于其对话性。它融会地回答了每个问题,给了我探索的场所,何况从不让东说念主以为它在强行倾销某个话题。这等于对话式 Agentic 诓骗的上风所在。
我再行诊疗了遐想,A8体育2026世界杯(中国)IOS/安卓官方下载优化对话经由而非数据组织。我大幅简化了高下文工程:我用一个 YAML 文献替代了通盘 Graph-RAG 系统,将 IRS 个东说念主扣除指南调遣后作为系统请示的高下文。模子使用 tool-calling 来更新三个输出文献:user-profile.yaml、deductions-tree.yaml 和 action-plan.yaml。我莫得让模子试图用无限的援用来去答用户问题,而是告诉它专注于提倡正确的问题:我让它把对话作为一场"20个问题"的游戏,尽量用最少的对话轮次详情用户的通盘扣除经验。
经验 2:能用一个 Agent 措置的,就不要用两个
这少许应该不言自明。在遐想诓骗架构时,我滥觞接洽使用一个 Agent 与用户对话,另一个来更新状态。同期,详情用户的税务扣除经验要么使用 Agentic Graph-RAG + 推理模子,要么使用一个"税务引擎"(一个 DAG,每个节点包含一个计算或决策。念念念念杂志上那些"你的男性名东说念主偶像是谁?"的脾气测试题,只不外问题酿成了"你有经验赢得哪些税务扣除?")。但要津在于:多个 Agent 意味着多个"高下文"。"状态更新"Agent 需要了解几许对话内容才能正确更新状态?它的高下文每次齐通常吗,照旧随每次函数调用而修改?Agent 之间怎样"通讯"?它们是开启对话,照旧使用"音问"函数互肖似信?
你的程序中运行的 Agent 越多,出现误疏导、繁芜乃至失败的空间就越大。道理的是,这亦然遐想详情味系统时的一个好准则:一个单体处事容器平常比 10 个通过易拉罐和绳索互肖似信的微处事更优雅、更容易达成。
经验 3:尊重 KV Cache
在滥觞构建诓骗时,我一直在纠结怎样向模子提供诓骗确现时状态(回来一下:user-profile.yaml、deductions-tree.yaml、action-plan.yaml)。咱们的税务助手必应知说念诓骗确现时状态才能提倡"最优"问题(即能措置最多未详情扣除项的问题)。但咱们应该怎样向它提供这些状态呢?要是咱们只是在每次用户回答时禁止提供新状态,凤凰彩票APP就会在高下文窗口中塞满旧状态的"阴魂"。咱们确乎需要一种门径让模子识别诓骗确现时状态,何况只是是现时状态。我滥觞的念念法既精真金不怕火又活泼:把状态径直响应到系统请示中!
这是一个首要虚伪。
LLM 有一个叫作念 KV Cache 的特质。它保存了与之前生成文本关联的已计算推理值。因此,在每个生成门径中,模子只计算最近生成 token 的关联。这意味着:1) 模子的运行本钱权贵镌汰,2) 它的扩展是线性的而非二次的(尤其适用于长高下文窗口),3) 你遥远不应该修改高下文窗口起头的 token。
要是你确乎剪辑了模子高下文窗口起头的高下文,就会迫使它再行计算你剪辑之后每个 token 的 KV 对。这相称娴雅。我第一次运行 James Joyce 的"高下文注入"达成时,一次 20 轮的对话就在 Anthropic API 上花了 1.50 好意思元。
我最终选用的措置决策是将现时状态作为用户现时问题的前缀注入,并在每次新的对话门径中,从用户之前的问题中剥离落伍的状态。要是让我回头检阅这个名堂,我会尝试在每个用户查询中保留通盘状态视图。
名堂 2:Scathach Agentic 导师
https://github.com/EvanMcCormick37/scathach-tutor

我在 Scathach 上确现时"统计"页面
这个名堂与我的个东说念主经历更近一些。往常一年我读了许多东西:研究答复、零丁著述、研究论文、博客著述等等。然则,我延续顾忌我方并莫得信得过从所读的内容中学到东西,或者这些学问在几个月莫得深切战斗后照旧渐忘了。
LLM 匡助我发展和测试对所读论文的意会。它们让我能立即与一个了解关系话题的实体进行对话。它们还不错创建测试题,让我能在惊东说念主的深度上测试我方对某个话题的意会。但我但愿这些对话能在我脑海中留住合手久的印象。
为了措置这个问题,我构建了 Scathach。它现实上等于"阅读著述 -> 回答对于该著述的小探员"的职责流,封装成了一个 Python 包。除了基本的探员功能外,它还将通盘已回答的问题存储在配备了 FSRS 算法的数据库中,这么跟着越来越多的文档被导入系统,用户不错选拔性地温习他们最不擅长的文档。它现在不错作为 Python 包安设在你的土产货 Python 环境中。
小九体育在线直播官网经验 4:警惕鸿沟延迟

在迭代 Scathach 和 James Joyce 时,我滥觞用 React 前端 + REST API + FastAPI 后端构建了 MVP。为什么不呢?归正编码通盘东西也只花了 15 分钟。
事实诠释,即使有 Agentic 编码用具,鸿沟延迟亦然相称竟然的。重构频频比运行构建更毒手,何况当你 vibe coding——对不起,"Agentic 工程化"——时,你一脱手并不会对架构有深切的意会。
我很快发现我方更可爱在莫得"全栈"架构的情况下建造这两个诓骗。当我脱手遐想和构建这些诓骗时,我对念念要什么和用例是什么有一个不详的念念法,但对职责流会是什么样貌并莫得融会的愿景。我发现这个精真金不怕火的遐想周期在快速迭代和检阅产物遐想方面相称高大:
遐想 -> 达成 -> 手动测试
一朝我对 Scathach 的职责流感到荒疏,我可能会把它构建成可膨大文献或云诓骗。不外现在,我应允于赓续用我阿谁小巧的 Python 模块进行迭代。
经验 5:限制学问遥远进击
是以……我确乎尝试过把 Scathach 构建成可膨大文献。更准确地说,我让 Claude Code 把 Scathach 构建成可膨大文献。我念念把它移植成一种我爸爸(他不太懂时间)能使用的体式。它构建了好意思满的前端和 API,将后端编译成二进制文献,并使用一个 Rust 库将通盘内容打包成一个不错安设到用户电脑上的 .exe 文献。
那么,我对 Rust、Tauri 或者将诓骗编译成二进制 .exe 文献了解几许?一窍欠亨。但 Claude 了解,是以应该没问题。嗯,要是我有这些方面的经验,可能确乎没问题。
现实发生的是,我花了一个小时搞明晰为什么 npm 构建剧本不职责,然后又为 Tauri 二进制文献查找和体式化图标,终末凯旋安设了 .exe……效劳安设后的程序打不开。
固然,我笃信只是犯了某个入门者舛讹。在 Tauri+Rust 二进制编译方面更有经验的东说念主会坐窝修好它。何况我信赖要是给阿谁东说念主 Claude Code 的使用权,他们会构建一个好 10 倍的诓骗版块,何况会恼恨说"这不是我我方写的"。但从某种道理上说,他们确乎写了。即使在依赖"众人 Agent"的时候……
……东说念主类专科学问仍然很进击。
这亦然我暂时把这个诓骗保留为 Python 剧本的另一个原因。独一我意会它,我就能智能地赓续更新它。
看到东说念主们为了"Agentic 智能"而遗弃东说念主类专科学问,这让东说念主感到缺憾。我以为社会正在走向《蠢蛋进化论》和《瓦力》那样的漫画式反乌托邦。但即使在智能 AI 系统的期间,那句老话依然适用:垃圾进,垃圾出(Garbage In, Garbage Out)。
就这些了凤凰彩票APP,诸君!要是你念念试试 Scathach,只需按照 README 上的安设阐发操作即可。


备案号: