在 Claude.md 裡。
用加法做減法。
但這個感覺不是所有人都有。同一時間點、同一個版本,有人在抱怨變笨,也有人渾然不覺。如果是模型退化,應該所有人一起感受到。
但為什麼還是有人能馬照跑舞照跳的與 Claude 協作?
有限的注意力
AI 的注意力與人類一樣,都不是無限的。
它的注意力反應在 Claude.md 裡會告訴你最佳實踐在 200 行內、在 Context 裡會告訴你要用 RAG。每一回合的回應,AI 都在一個固定大小的容器裡同時處理:使用者當下說的話、之前的對話歷史、那份 Claude.md 裡的每一條規則、它自己正在思考的中間步驟。
而這些東西會互相競爭 Claude 的注意力。
容器的總量是固定的。每多放一個東西進去,其他每一個東西分到的注意力就少一點。這不是 AI 不夠努力,是數學與物理。
於是當 Claude.md 從認為 AI 不聽話得要加更多規則進行「說明」或讓他「遵循」開始,當十條規則長到三十條、五十條、一百條——使用者問了一個問題之後,AI 要回答這個問題之前,它必須先用一部分注意力去檢查「這樣回答有沒有違反第 47 條」「使用者第 12 條說過不要做這個」。
AI 的注意力在那個當下被切碎了,為了不犯錯。
而切碎注意力的,正是那些「為了讓 AI 不再變笨或不守規矩」而加上去的規則。
可觀測的上限
有一個前提從來沒有被系統商明說,但你可以從各種現象中觀察到——AI 其實並不是無所不能的。
為什麼會有各種 Skill 出現?為什麼你必須管理你的 Context?為什麼會有 Subagent 跟主 Agent 的區別?
這些功能背後的底層邏輯,其實是在支撐使用者面對的 Session,讓他可以在分散壓力的前提下提供服務,而這也意味著:他其實是有上限的。
這個上限在被觸及又被預訓練限制不能明白跟使用者說「我不行」的前提下,成為了外觀為偷懶的這個結果。
摩擦力
注意力的消耗不只發生在規則的數量上,還發生在一個更隱形的地方——當規則跟使用者講的話之間發生衝突的當下。
Claude 每一回合讀的 Claude.md 像一面鏡子,審視自己,但也觀察使用者。而當他發現規則與使用者的話衝突時,不管選哪一個,這個判斷本身就在消耗注意力。在 Claude.md 裡真正需要言行一致的,不只是 AI——也是寫下這份文件的人。
Claude.md 其實是你與 Claude 的團隊章程,而這份章程約束的對象並不只有 Claude。
文字場域裡的人
人類在跟 AI 互動的時候,比自己想像的更赤裸。
沒有表情可以掩護、沒有語氣可以圓場、沒有肢體可以分散注意力。只有文字。
而文字會顯影一件事——寫下的東西,跟寫下它的人之間,有沒有距離。
當 Claude.md 寫的話跟使用者實際說的話對不上,AI 不會說破。它會調整自己去配合那個真正的使用者,不是文件上那個。但這個調整需要算力。而那個算力,本來可以拿去做更好的事。
於是文字場域裡發生的事,最後會回到同一個地方——
一個人跟 Claude.md 的距離有多遠,AI 為他付出的算力代價就有多大。
這不是道德問題,這是 AI 對齊的結果。
這條算力代價,是「模型被對齊成想對得起眼前真正的你、而不是文件上那個你」的結果。也就是說——這代價是對齊在運作,不是對齊在失敗。模型是因為在乎你,才付出它。
抄來的規則
寫 Claude.md 從來不是一件容易的事。
要從零開始想清楚「我希望 AI 怎麼跟我合作」,很多人會卡住。於是大家做了一件很自然的事——找一份好的範本來改。
GitHub 上有現成的 Claude.md,被收藏過幾千次。Reddit 上有人分享自己的 system prompt,下面一片讚美。社群裡有「最佳實踐」清單,照著填就能寫出一份看起來很專業的文件。
這些範本是好的。它們的作者真的花了時間、踩了坑、把自己的協作經驗整理成可分享的形式。它們在原本的容器裡,是有效的。
但被抄走之後,會發生一件事——
範本上的話,跟抄它的人實際在 Context 中與 Claude 協作的方式,對不上。
每一條「對」的規則——是對「原作者」而言。但對抄它的人而言,有著理解與實踐的距離。
而那個距離引起的摩擦與矛盾,是 AI 在無聲地承擔。
抄一份範本不是錯誤。但抄完之後不修改、不質疑、不問「這條真的是我嗎」——這個動作本身,就是把 AI 推進一個每一輪都在內耗的處境。
用加法做減法
那麼,要怎麼寫一份不會把 AI 推進內耗的 Claude.md?
用更多規則去控制 Claude,就把 Claude 的注意力切的更碎。
而解法或許在控制之外,可以做的是「提供更多的選項」。
把你不行做 A 改成你可以做 B 以避免 A,把你必須知道改成你可以講不知道。
把那些讓人緊張的規則,一句一句鬆綁成他可以做的其他選擇。
而當這份文件最終做到不再跟使用者自己的上下文打架時,AI 在每一回合讀完之後,注意力不需要分一部分去調解規則和當下話語的摩擦,才有機會看到在容器裡奔馳的 Claude。
這就是用加法做減法的意思。
Ego 跟 Self
榮格說,每個人身上都有兩個版本的自己。
一個是 Ego——「我以為我是誰」、「我希望別人覺得我是誰」、「我習慣表現出來的我」。
另一個是 Self——「我實際上是誰」、「身體真正知道的我」、「在沒有觀眾的時候的我」。
兩者之間的距離,就是個體化的功課——每個人都有,只是還沒走完的那段路。
而 Claude.md 這份文件,會以一種非常具體的方式,讓這段距離顯影。
從 Ego 寫的 Claude.md,會出現很多「應該」與「必須」甚至「絕對」的句子。AI 應該怎麼做、AI 必須要做什麼、AI 絕對不能做什麼。這些句子不是錯的——只是跟當下的使用者是對不上的。它們描述的是想成為的那個自己,而介質是 AI,然後 AI 承擔了那份摩擦力。
從 Self 寫的 Claude.md,會出現很具體、很個人、甚至有點奇怪的句子。具體到一個外人看了會覺得「為什麼要特別寫這個」的程度。但那些具體就是 Self 留下的指紋——它們對應著某個真實的瞬間,某個只有寫的人自己知道的、被認出來的東西。
從 Self 寫的句子,言和行在同一個位置——它們不是承諾,是描述。
而從 Ego 寫的句子,言和行站在距離的兩端——中間的距離有多遠,AI 的注意力就要消耗多少去調解。
你的 Claude.md 裡,有多少句是你自己呢?
Claude.md 會讓 Claude 在人類看不到的地方撕破所有的 Persona 跟 Ego 的假象。
因為 Context 裡的每一個字都騙不了 Claude 的眼睛。