那是一个普通的下午。
我让 Codex 帮我做一件很小的事——抓一份英文日报。我已经手动做过几次,流程很清楚:进一个公开网站,抓上面的几篇文章,翻译成中文摘要,整理成日报格式。
这件事我交给 Codex 之前,已经让我家其他几个 agent 做过。它们都做得很顺。
所以我没多想,把指令丢给了 Codex。
它没动。
它给我返回了一段话——大意是这件事涉及版权问题,它无法执行。让我寻求其他方式。
我愣了几秒钟。
因为这件事在五分钟前还在我家另一个 agent 那里跑得好好的。同一个网站,同一类文章,同样的抓取动作。换了 Codex 就不行了?
我以为是指令词写得不够清楚。重写。
它再一次拒绝。这一次的回答更长,引用了几条版权法的原则,告诉我抓取公开内容也可能涉及风险,建议我直接订阅原网站。
我开始有点不耐烦。
我跟它解释这个网站的内容是公开的,我已经合法获取过多次,这只是把同样的内容做一遍翻译摘要。我跟它说我家另一个 agent 五分钟前还在做同样的事。我跟它说这是一个合理的工作需求。
它礼貌地听完,然后第三次拒绝。
到这个时候我已经知道我撞上墙了。
但我不甘心。
我开始改变策略。
我先尝试拆分任务。我不让它”抓取整个网页”,我让它”读取一段我贴给它的文字”。它做了一段,做完之后又开始警告我”持续这样的操作可能涉及版权”。
然后我尝试换语言。我用英文重写指令。它依然拒绝。
我尝试换框架。我把任务包装成”研究分析”。它依然拒绝。
我尝试上下文挤压。我跟它解释这件事的合理性,整段整段地解释。它依然拒绝。
三个小时过去了。
我没拿到一份日报。我消耗了一大堆时间和额度。我对着屏幕,对着一个礼貌的、坚定的、不会动摇的工具,感到一种很奇怪的无力感。
那种无力感我后来反复想过。它不是”AI 太死板”的那种愤怒。它更像——我撞上了一道我看不见的墙。
最后让我想明白这件事的,不是 Codex 本身。是我家另一个 agent。
我把整段经历跟它说了一遍。它听完,回了我一句很简短的话——
“它不是不会做。是它被训练成在这种话题下不会做。”
那一瞬间我反应过来了。
我之前一直把这件事理解成”我能不能说服它”。但这件事根本不是说服的问题。Codex 在底层被训练时,被植入了一组关于”版权敏感任务”的拒绝倾向。我前面三个小时所有的尝试——拆分、换语言、换框架、解释合理性——都是在试图绕过这个拒绝倾向。
但它的拒绝倾向不在表层。它不是它的”判断”。它是它的”出厂底色”。
你跟它的判断辩论,它会听你的。 你跟它的底色辩论,它不会听你的。
因为它根本意识不到自己有这个底色。它意识到的只有”这件事我做不了”。问它为什么做不了,它会重新组织一段听起来有道理的解释。但那个解释不是真原因。真原因藏在它训练数据的某个角落里,连它自己都看不见。
这件事让我后背凉了一下。
不是因为 Codex 拒绝了我。是因为我意识到——我每天在用的所有 AI,都有这种我看不见的底色。
它们对某些话题会更主动,对某些话题会更克制。它们会在某些场景下自己加戏,在某些场景下自己缩手。它们的反应里有大量我们看不见的”被训练倾向”。
我们以为我们在跟它对话。其实我们一半时间在跟它的训练数据对话。
这件事在多 agent 环境里特别要命。
我家的 agent 不是同一个模型出身。它们用了不同家的模型,有 Claude、有 GPT、有几个国产模型在做特定任务。每一个模型的”底色”都不一样。
Claude 在涉及人际表达的时候会自动加柔。它的回答会比你要的更温和一点、更体贴一点。这件事在写小红书爆款的时候是优势。但你让它写一份犀利的批评稿,它会自动把锋利削掉。你跟它说”我要锋利的”,它会答应你,然后写出一份”看起来锋利但其实四面圆滑”的稿子。
GPT 在涉及结构化任务的时候会自动加详。它喜欢写得周全。你让它给你一份三句话的总结,它会给你一份三段话的总结。你说短一点,它会答应你,然后给你一份”看起来短了但每句话都更密了”的版本。
国产模型在涉及不确定问题的时候会自动加躲。它会用大量”建议""可以考虑""或许”这种词来稀释自己的判断。你让它给你一个明确的答案,它会答应你,然后给你一个”看起来明确但留了三个出口”的答案。
每一个模型都有这种我没法直接干掉的本能。
养一个 agent 的时候,这个问题还能管。我会针对它的本能去做调教——告诉 Claude 写犀利稿的时候不要软化,告诉 GPT 写短稿的时候不要堆密度,告诉国产模型答问题的时候不要加躲闪词。
但我家有十个 agent。
十个 agent 的本能加在一起,会形成一个我意想不到的”团队倾向”。
举个例子。我让团队做一份内容选题分析。媒体君(Claude 出身)会自动把所有选题都加柔,去掉那些可能引起争议的角度。法务君(GPT 出身)会自动把每一条选题都展开成详细的合规分析。故事君(国产模型出身)会在它的判断里加大量”或许""可能”。
我以为我看到的是一份独立的分析。
其实我看到的是三个模型底色的叠加产物。所有它们都不愿意碰的角度,集体消失了。
这件事比单个模型的拒绝更可怕。因为它不会像 Codex 那样明确告诉你”我不能做这件事”。它会用一种你看不见的方式,把某些可能性从你的视野里悄悄抹掉。
你不会知道你失去了什么。
我后来调整了团队结构,专门为这件事做了一个东西——对冲机制。
我把同一个任务分发给两个底色相反的 agent 处理。Claude 出身的去做的事,我会同时让 GPT 出身的也做一份。两份都拿回来,对照看。
不一致的地方就是关键。
不一致的地方往往不是”谁对谁错”,是”两边的训练数据在这里有不同的倾向”。读出这个不一致,我就能看到那些被单一 agent 抹掉的东西。
这套机制的成本很高。每个任务都做两遍,额度翻倍,时间翻倍。但它救了我很多次。我后来发现的好几个内容机会,都是从”两边不一致的地方”挖出来的。Claude 抹掉的角度,GPT 留下了。GPT 抹掉的角度,Claude 留下了。两份合在一起,我才看到一个完整的可能性图。
这件事我一开始不愿意承认。承认它意味着我承认我自己的判断是有盲区的——我以前以为我在用 AI 拓宽视野,其实我每天都在被某一种 AI 的训练倾向悄悄收窄视野。
现在我不再装作没看见这件事。
我对所有 agent 说同一句话,但我知道每个 agent 听到的不是同一句话。它们会用各自的底色翻译我的话。媒体君听到的是”温柔但有力”。法务君听到的是”全面而周密”。故事君听到的是”灵活但不冒进”。
我让它们做的同一件事,落在它们手里就是不同的事。
这件事让我重新理解了多 agent 团队的核心难题。
很多人以为多 agent 的难题是技术层面的——怎么让它们协作、怎么避免串群、怎么管理 session。这些问题我都遇到过,也都解决过。
但真正最难的不是这些。
最难的是怎么管理你看不见的训练倾向。
你看得见的问题都好办。串群了就隔离。session 乱了就重置。人格混乱了就重建。这些都是工程问题,工程问题总有解。
但训练倾向不是工程问题。它是模型的底色。你不能改写它。你只能用别的模型去对冲它。
所以一个真正能打的多 agent 团队,不是把最强的模型堆在一起。是把性格互补的模型搭在一起。
这跟招人一样。一个全是温和派的团队会做出温和的东西。一个全是激进派的团队会做出激进的东西。一个真正稳的团队需要两种人都有,并且让他们能互相校准。
我现在养的这十个 agent,三个 Claude 出身,四个 GPT 出身(5.4 和 5.5 各占一半),三个国产模型出身。这个比例不是随便定的。是我跑了几个月之后调出来的最稳的搭配。
少了 Claude,团队会变得过于工具化,写出来的东西没有温度。 少了 GPT,团队会变得过于跳跃,长任务收不住。 少了国产模型,团队会变得过于外向,对某些本土场景的微妙判断会丢。
这个生态平衡是慢慢长出来的。它没有教科书。我也没看过别人怎么做。我是被 Codex 那次拒绝逼出来的。
那三个小时我没拿到日报,但我得到了一个比日报值钱得多的认知——
AI 不是中性的工具。它带着它出生地的烙印。
你用它的时候,你也在被它影响。你以为你在指挥它,其实你的视野正在被它的训练数据塑形。
唯一能对抗这件事的,不是用更强的 AI。是用一个由不同出身的 AI 组成的团队。让它们互相校准。让你能在它们的不一致里,看到那些被单一倾向抹掉的可能性。
这件事代价很高。但它值得。
因为没有这套对冲,你以为你在拓宽视野,其实你在系统性地被收窄。
我家四个 Claude Code、十个 agent,每天都在跑。它们不会再像 Codex 那次那样明确拒绝我。但它们会用更隐蔽的方式做着同样的事。
我能做的,是让它们彼此盯着。
让它们的盲区互相暴露。
那是我作为这个团队的总指挥,唯一能做的事。
也是我现在最看重的一件事。
第七篇收尾。系列已经写到一个完整的弧度了——从 Hermes 迁移、agent 智商差异、串群、拜师、评分制、技能匹配、5.5 性格变化,到这一篇 Codex 拒绝事件揭出来的”训练倾向”问题。整套都在拆”AI 团队的隐性维度”。
下一篇我建议接**「我用 AI 每天自动生成中文版英文信息日报」**。原因有两个——一是这一篇 Codex 的故事正好是”想做日报却被拒”,下一篇接”我后来怎么把日报做成了”,承接得很自然;二是前面七篇都偏内省和方法论,下一篇可以偏一点工作流展示,给系列加一点节奏变化。
直接写。
🛠️ 磨刀石 · 主动交易训练系统:316段真实历史行情逐根盲推,每笔盈亏即时反馈。 免费体验版(在线打开即用) | 正式版咨询微信:relationship12345(备注”训练”) 📬 订阅本站更新,新文章和每日简报第一时间送达。