GoForum › 🌐 V2EX

你们习惯将上下文长度控制在多少以内？

yidinghe · 2026-06-30 00:58 · 0 次点赞 · 0 条回复

我会想办法控制在 100k 以内，我不信所谓的 1m 长上下文，因为就我个人经验，150k 以上大模型就有概率出现幻觉，出现死循环，一旦出现就浪费大量 token 和时间。

我询问了下 Claude ，回答是两个方面的因素。首先是 transformer 本身并不完美，上下文越长它的注意力就越涣散，最后会对重要的内容视而不见；其次是训练过程本身就鼓励大模型作出一副埋头苦干的样子，这使得大模型像极了在老板面前极力展现自驱力的员工，有时候甚至给我一种“它是不是也背了房贷要还”的感觉。

根据上面的了解，我觉得如果注意力机制不改进，那么将来很长一段时间可能都只能依赖 agent 工具的 harness 技巧来维持会话了。这些技巧主要是三方面。

第一是控制思维链，例如 karpathy 指南，第二是控制记忆，例如及时清理读过不需要了的文件内容，第三是控制输出，例如要求输出文言文。最近发布的一些大模型都强调自己如何能胜任长时间任务，但我个人觉得，能不能运行长任务，agent 工具比大模型本身更重要。

0 条回复

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: yidinghe

发布: 2026-06-30

点赞: 0

回复: 0