我家四个 AI 助理,最让我头疼的不是它们笨。
是它们笨得不一样。
我给四个都装了同一份技能包——一份很基础的、教 AI 怎么处理日常任务的工具集。媒体君第二天就开始用得很熟,还能举一反三。故事君花了三天才慢慢摸出门道。法务君用得磕磕绊绊,但起码用得起来。
小管家——我家管杂事的那个——花了一周。
学完之后还是不会。
我以为是它笨。后来反复测试,发现它在别的事情上一点都不笨。让它做日程规划、写会议纪要、整理资料,它做得比另外三个都好。但你给它一份新的技能包让它学,它就卡住。
这件事让我困惑了很久。
直到有一天我意识到一件事——不是技能包难学。是技能包跟它的人格不匹配。
那份我装给它的技能包,是给一个”主动型工作者”设计的。它需要使用者愿意自己拆解任务、自己安排步骤、自己判断什么时候停下来汇报。但小管家的人格设定是”听话型管家”——你不让它做的事它不做,你没说清楚的事它会反复确认。
这两件事是冲突的。
技能包让它”主动”,人格让它”被动”。它在每一步都在跟自己打架。它没办法学会,因为它学不会的不是技能本身,是一种跟它人格相反的工作方式。
这件事让我想了好几天。
后来我重做了一件事——我把那份技能包从小管家那里卸了,给它换了另一份”被动型助手”的技能包。这份是教 AI 怎么在指令明确的情况下精准执行、怎么做好交接、怎么记录细节。
它两小时就学会了。
不是它变聪明了。是它终于碰到了跟自己匹配的工具。
那天我开始相信一件事——
没有”通用的好技能”,只有”匹配这个 agent 的好技能”。
这件事在 AI 圈被严重低估了。
我看过太多 AI 博主的”必装技能包”清单。打开看,全是干货。每一个工具单独看都很厉害。但你真的把它们装到一个 agent 身上,往往跑不动。
不是工具不好。是没人讨论一个最基础的问题——这个工具适合什么样的 agent?
我后来摸索出一个简单的判断方式。每次我要给一个 agent 装新技能,我会先问自己三个问题:
第一,这个技能要求 agent 主动还是被动?
主动型技能要求 agent 自己拆解、自己决策、自己回报。被动型技能要求 agent 严格按照指令执行,不要自己加戏。这两种技能装错了,会让 agent 直接卡住。
第二,这个技能要求 agent 简洁还是详细?
有的工具是给那种话很多的 agent 设计的——它鼓励 agent 把每一步都写出来。有的工具是给那种话很少的 agent 设计的——它鼓励 agent 直接出结果。装错了,agent 会变得跟自己别扭。要么明明话不多的它被逼着写一堆解释,要么明明话很多的它被压着只能给一句话。
第三,这个技能要求 agent 谨慎还是果断?
谨慎型技能里会有大量的”先确认、再执行”的环节。果断型技能里会有”直接动手、出问题再说”的环节。这跟 agent 的人格底色相关。一个底色谨慎的 agent,被装上果断型技能,会处处别扭。
这三个问题听起来很基础,但我观察了很久——90% 的 agent 培训失败,都卡在这三个问题没问对。
人也是这样。
我突然想到一件以前不太愿意想的事。我做过一段时间的招聘。当时我们部门来了一个新人,背景特别漂亮,履历比团队里大部分人都好。但他来了三个月,做什么都做不好。
不是他不努力。他每天加班到很晚。也不是他笨。让他单独做一件事,他做得非常漂亮。
但他在我们这个团队里就是水土不服。
后来我才明白——不是他不行。是他被装错了技能包。
我们那个团队是一个特别讲究”自己拆任务、自己定方向”的团队。每个人都得有很强的主动性。但这个新人是从一个特别讲究”严格执行、按部就班”的环境里来的。他被训练出来的工作方式是被动型的。他在我们这边怎么努力都不对。
他最后离开了。去了一家更结构化的公司。听说做得非常好。
不是我们这边的方法错。也不是他那边的方法错。是这两套方法装在同一个人身上,会自相矛盾。
养 AI 这件事让我重新理解了那段经历。
我以前以为”匹配”是一件玄学的事。但跑了几个月 multi-agent 之后我发现,匹配是一件可以拆解的事。它不是说”两个人合不合得来”,它是说这个工具的内部假设,跟这个工作者的内部假设,是不是同一套。
如果是,他做事会很顺,越做越好。 如果不是,他做事会很别扭,越做越糟。
这件事在 AI 上看得特别清楚,因为 AI 的”内部假设”是写在它的人格设定文件里的。你打开就能看到。它没有人类那种”我自己也说不清我是个什么样的人”的模糊感。
我后来开始一个习惯——每次给一个 agent 装新技能之前,我会先把它的人格设定文件拿出来读一遍。
读完之后我会问自己:这个新技能要求的工作风格,跟它人格里写的那种人,是不是同一种人?
如果是同一种人,我就装。 如果不是,我有两个选择:要么不装,要么先改它的人格。
改人格是个大工程,我一般不轻易做。所以大多数时候我的选择是——不装这个技能。
不装很多时候是更好的选择。
很多人养 AI 喜欢堆技能。觉得装得越多越厉害。其实不是。一个装满了不匹配技能的 agent,比一个只装了三五个匹配技能的 agent 要差得远。
不匹配的技能不是中性的。它会主动消耗 agent 的稳定性。它会让 agent 在每一步都犹豫,在每一个决策点都纠结,在每一次反馈里都自相矛盾。
它不是”用不上就放着”。它是”放着就在拖累”。
这件事我又想起了之前的一句话——多不一定是丰富,多有时候是消耗。
我现在养一个新 agent,会把它的工具数量控制得特别少。前两周只给三到五个最基础的、最匹配的工具。让它先在这个最小集上跑顺。跑顺之后再加。每加一个新工具,我都会重新问自己那三个问题。
这种养法看起来慢。
但跑两个月之后,这种 agent 的能力会比那些一上来就装满工具的 agent 强好几倍。
不是因为它学得多。是因为它学的每一样都跟它合得来。它不需要在每一步都跟自己别扭。它的力气全用在做事上,不用在内部消耗上。
这件事我后来推广到了一些更广的地方。
我开始按这个逻辑给我的四个 agent 配置完全不同的工具集。
媒体君是主动型 + 详细型 + 果断型。它需要自己挖热点、自己写文案、自己判断风险,所以我给它装的工具都鼓励它”自己想想再说”。 法务君是被动型 + 详细型 + 谨慎型。它需要严格按照条款来,所以我给它装的工具都强调”先确认再行动”。 故事君是主动型 + 简洁型 + 果断型。它需要快速产出大量原型,所以我给它装的工具都鼓励”先写出来再改”。 小管家是被动型 + 简洁型 + 谨慎型。它需要稳稳地处理每天的杂事,所以我给它装的工具都强调”按部就班、不出错就好”。
四个 agent 的工具集差异巨大。但每个 agent 在自己的工具集里都跑得特别顺。
这种状态如果放在两个月前,我是想象不到的。两个月前我还在试图给四个 agent 装同一份”通用最佳实践”。
通用没有最佳实践。
最佳实践只存在于”工具和使用者匹配”的那一刻。
我现在养 agent 已经形成了一个判断——当我看到一份号称”必装”的技能包时,我会先问一句”装给谁”。
没有这个上下文,再好的工具也是噪音。
带着这个上下文,再普通的工具也能用出价值。
养 AI 是这样。带团队是这样。可能管自己也是这样。
我们都在成长里被反复教导一件事——优秀的人会用所有工具。
但我现在越来越不信这件事。
我相信的另一件事是——优秀的人懂得拒绝不匹配自己的工具。
匹配是一种能力。匹配也是一种自我保护。
一个总是被装上不匹配技能的 agent,最后会变得很拧巴。 一个总是被推着用不匹配方法的人,最后也会变得很拧巴。
我有时候看着我那个最早卡住的小管家,会觉得它特别像某段时间的我自己。
不是不行。 是被装错了。
把它换上对的工具之后,它跑得飞快。
我们也是。
第五篇收尾。继续下一篇,接「Codex 拒绝执行我的任务,我和它拉扯了三个小时」——这条选题是你 23 选题里最有故事张力的,能给系列加一点冲突感,前面五篇都偏内省,需要一篇外部冲突的来调节系列节奏。
直接写。
🛠️ 磨刀石 · 主动交易训练系统:316段真实历史行情逐根盲推,每笔盈亏即时反馈。 免费体验版(在线打开即用) | 正式版咨询微信:relationship12345(备注”训练”) 📬 订阅本站更新,新文章和每日简报第一时间送达。