岳飛與袁崇煥為何悲劇收場？博弈論與經濟學的歷史重新解讀

紹興十一年十二月二十九日（1142年1月27日），岳飛在大理寺獄中被賜死，年僅三十九歲。罪名是「莫須有」——或許有。^[1] 四百八十六年後，崇禎三年八月十六日（1630年9月22日），袁崇煥在北京西市被凌遲處死，「京師百姓爭買其肉啖之」。^[2] 罪名是「通敵叛國」。兩位名將，都死於他們誓死效忠的朝廷之手。傳統敘事將此歸因於昏君與奸臣——趙構聽信秦檜，崇禎中了反間計。但這種解釋過於依賴個人的「昏」與「奸」，忽略了更深層的結構性因素。當我們用博弈論的框架來分析這兩個案例時，會發現：功臣與君主之間的互動，本質上是一場信息不對稱下的重複博弈；而在某些條件下，這場博弈的均衡解，就是悲劇。

一、委託—代理問題：功臣困境的經濟學本質

1.1 當皇帝成為委託人

從經濟學的角度看，皇帝與功臣的關係，本質上是一種「委託—代理」（Principal-Agent）關係。^[3] 皇帝（委託人）需要功臣（代理人）去執行某些任務——打仗、治理、維護秩序；但皇帝無法完全觀察功臣的行為與意圖，這就產生了「信息不對稱」。

委託—代理問題的核心困境在於：代理人可能利用信息優勢，追求自身利益而非委託人的利益。在企業情境中，這表現為經理人「偷懶」或「掏空公司」；在政治情境中，這表現為功臣「擁兵自重」或「謀反篡位」。

詹森（Jensen）與梅克林（Meckling）在1976年的經典論文中指出，解決委託—代理問題的方法有三：^[4]

監控（Monitoring）：委託人投入資源監視代理人的行為。
激勵（Incentive Alignment）：設計薪酬結構，使代理人的利益與委託人一致。
約束（Bonding）：代理人主動提供擔保或接受限制，以證明自己不會背叛。

在帝制中國，這三種機制都存在嚴重的缺陷：

監控的極限：皇帝身處深宮，對前線的情況高度依賴將領的奏報。信息傳遞延遲、失真，甚至被刻意操控。岳飛在前線的作戰情況，趙構能真正了解多少？
激勵的困境：如何獎賞一個「功勞太大」的將領？封王？給他更多軍隊？這些獎勵本身就會增加他謀反的能力。
約束的不可信：功臣如何證明自己「沒有異心」？效忠的誓言是廉價的（Cheap Talk），任何人都可以說。真正的約束需要「成本高昂的信號」，但什麼信號才足夠可信？

1.2 岳飛的「代理人」困境

岳飛面臨的，正是一個極端版本的委託—代理問題。

紹興十年（1140年），岳飛率軍北伐，連戰皆捷，收復大片失地。但他的成功本身，卻成為他最大的危機。此時的岳飛：

統帥岳家軍十萬餘人，是南宋最強大的軍事力量。^[5]
在軍中擁有極高的個人威望，「岳家軍」之名本身就說明了軍隊的私人化傾向。
公開主張「迎回二聖」——如果徽、欽二帝真的被迎回，趙構的皇位將陷入尷尬。^[6]

從委託人（趙構）的角度看，岳飛的「代理人風險」極高：

能力風險：岳飛有能力謀反——他的軍事實力足以挑戰中央。
意圖的不可觀察：岳飛是否有謀反之心，趙構無法直接觀察，只能推測。
行動的不可逆：一旦岳飛決定謀反，後果將不可挽回。

在這種情況下，「莫須有」的邏輯就變得可以理解——不是「或許有罪」，而是「或許會有風險」。從風險管理的角度，當一個人的潛在威脅足夠大，而你又無法確認他的真實意圖時，「預防性清除」就成為一種理性的選項。^[7]

這不是為趙構辯護——他的決策可能是錯誤的、不道德的、甚至是愚蠢的。但這個決策並非完全「非理性」，它有其結構性的邏輯。

1.3 袁崇煥的「道德風險」

袁崇煥的案例則呈現了委託—代理問題的另一個面向：道德風險（Moral Hazard）。

天啟六年（1626年），袁崇煥在寧遠擊退努爾哈赤，一戰成名。^[8] 崇禎即位後，袁崇煥被任命為薊遼督師，獲得「便宜行事」的全權。他向崇禎承諾：「五年復遼」。^[9]

然而，袁崇煥在獲得全權後的行為，引發了嚴重的「道德風險」疑慮：

擅殺毛文龍：崇禎元年（1628年），袁崇煥未經朝廷批准，以「十二大罪」處死東江總兵毛文龍。^[10] 這一行動展示了他不受約束的權力——如果他可以擅殺一名總兵，他是否也可能對朝廷採取類似行動？
私自議和：袁崇煥曾私下與後金接觸，試圖議和。^[11] 這種「先斬後奏」的外交行為，讓朝廷對他的忠誠產生懷疑。
己巳之變的疑點：崇禎二年（1629年），皇太極繞過袁崇煥的防線，直逼北京。袁崇煥率軍回援，但他為何沒有提前預警？為何讓敵軍通過他的防區？^[12]

從委託人（崇禎）的角度看，袁崇煥的行為模式極為可疑：他獲得了極大的權力，卻以難以理解的方式使用這些權力。即使沒有後金的「反間計」，崇禎對袁崇煥的信任也已經動搖。^[13]

二、信號博弈：忠誠如何證明？

2.1 斯彭斯的信號傳遞模型

2001年諾貝爾經濟學獎得主麥可·斯彭斯（Michael Spence）在1973年提出了「信號傳遞」（Signaling）模型，用以解釋信息不對稱下的市場行為。^[14]

斯彭斯的核心洞見是：當信息不對稱存在時，擁有私人信息的一方可以透過「成本高昂的行動」來傳遞可信的信號。例如，求職者透過獲取學歷（一個耗時耗財的過程）來向雇主證明自己的能力；企業透過高額的廣告投入來向消費者證明產品質量。

信號要有效，必須滿足一個關鍵條件：分離均衡（Separating Equilibrium）——不同類型的人，發送同一信號的成本必須不同。如果忠臣和叛臣發送「忠誠信號」的成本相同，那麼這個信號就沒有區分能力。^[15]

2.2 「忠誠信號」的失敗

岳飛與袁崇煥的悲劇，可以理解為「信號傳遞失敗」。

岳飛試圖發送的忠誠信號包括：

多次請辭，表示無意戀棧權位。
紀律嚴明的治軍風格——「凍死不拆屋，餓死不擄掠」。^[16]
「精忠報國」的背刺——字面意義上的「以身相許」。^[17]

然而，這些信號都不足以形成「分離均衡」：

請辭是廉價的：任何有野心的人都可以假裝謙讓，等待更好的時機。歷史上，曹操「三讓」丞相之位，王莽「三讓」帝位，都是先例。
治軍嚴明可以是策略：一個意圖謀反的將領，同樣會維持軍紀以增強戰鬥力。
紋身無法證明意圖：背刺「精忠報國」是一次性的行為，無法證明未來的持續忠誠。

更糟糕的是，岳飛的某些行為發送了相反的信號：

「岳家軍」的名稱暗示軍隊的私人化。
多次抗命——紹興七年（1137年），岳飛因對和議不滿，曾擅自離軍，返回廬山為母守孝。^[18]
「迎回二聖」的口號——無論岳飛的本意為何，這句口號在客觀上威脅了趙構的皇位正當性。

2.3 袁崇煥的混合信號

袁崇煥的信號傳遞更加混亂。

一方面，他發送了強烈的「能力信號」：

寧遠大捷證明他是明朝最能打的將領。
「五年復遼」的承諾展示了他的雄心與自信。

另一方面，他的行為卻發送了矛盾的「意圖信號」：

擅殺毛文龍展示了他不受控制的傾向。
私下議和暗示他可能有自己的議程。
己巳之變中的可疑表現——究竟是能力不足，還是有意縱敵？

從信號理論的角度看，袁崇煥陷入了一個悖論：他的「能力信號」越強，他的「意圖信號」就越重要；但他的行為卻讓「意圖信號」變得模糊甚至負面。^[19]

三、可信承諾問題：為什麼「誓言」不夠？

3.1 謝林的承諾理論

2005年諾貝爾經濟學獎得主湯瑪斯·謝林（Thomas Schelling）在其經典著作《衝突的策略》中，深入分析了「承諾」（Commitment）的問題。^[20]

謝林指出，在戰略互動中，「承諾」要有效，必須是「可信的」（Credible）。一個可信的承諾，必須讓違反承諾的成本高於遵守承諾的成本。口頭的誓言、情感的表白，都不足以構成可信承諾——因為事後違反的成本太低。

可信承諾的典型機制包括：

人質（Hostage）：將有價值的東西置於對方控制之下。例如，古代諸侯送質子到天子處。
燒毀橋樑：消除自己的退路，使違約成為不可能或極端昂貴。
聲譽機制：在重複博弈中，違約會損害聲譽，影響未來的合作機會。
第三方強制執行：引入有能力懲罰違約者的第三方。

3.2 功臣的承諾困境

岳飛與袁崇煥面臨的核心問題是：他們無法建立可信的「不謀反」承諾。

讓我們逐一檢視可能的承諾機制：

人質機制

岳飛的家眷確實在朝廷控制之下。但人質機制的有效性取決於功臣對家眷的重視程度——一個足夠冷血的野心家，可能願意犧牲家人換取帝位。趙構無法確定岳飛屬於哪一種人。

燒毀橋樑

功臣如何「燒毀」自己謀反的能力？唯一的方法是放棄兵權——但這恰恰是功臣最有價值的資產。曾國藩選擇了這條路（裁撤湘軍），^[21]但岳飛與袁崇煥都是在戰爭尚未結束時被處理，他們沒有「裁軍」的時機。

聲譽機制

聲譽機制需要重複博弈的預期——「如果我這次違約，未來就沒人會信任我」。但對於一個考慮謀反的功臣而言，謀反是一次性的博弈——如果成功，他就成了皇帝，不需要別人的「信任」；如果失敗，他就死了，聲譽毫無意義。因此，聲譽機制對防止謀反無效。

第三方強制執行

在帝制中國，沒有任何第三方有能力「強制執行」功臣的忠誠承諾。皇帝本身就是最高權力，沒有更高的權威可以訴諸。

結論是：在帝制結構下，功臣無法建立可信的「不謀反」承諾。這不是岳飛或袁崇煥的個人失敗，而是制度結構的必然結果。^[22]

四、囚徒困境：功臣與君主的悲劇博弈

4.1 不完全信息下的互動

讓我們將功臣與君主的互動模型化為一個博弈。

假設功臣有兩種類型：「忠臣」和「潛在叛臣」。這是功臣的私人信息，君主無法直接觀察。君主也有兩種策略：「信任」或「清除」。

博弈的報酬結構如下：

如果功臣是忠臣，君主選擇信任 → 雙方都受益（功臣繼續效力，君主獲得忠誠的服務）
如果功臣是忠臣，君主選擇清除 → 君主承擔道德成本和能力損失，功臣被冤殺
如果功臣是潛在叛臣，君主選擇信任 → 功臣可能謀反，君主面臨巨大風險
如果功臣是潛在叛臣，君主選擇清除 → 君主避免了風險，功臣被消滅

在這個博弈中，君主面臨的是一個「統計決策」問題。^[23] 他需要在「誤殺忠臣」（Type I Error）和「放過叛臣」（Type II Error）之間權衡。

4.2 貝葉斯均衡分析

從貝葉斯博弈（Bayesian Game）的角度分析：^[24]

設 p 為功臣是「潛在叛臣」的先驗機率。君主的決策取決於：

p 的大小（他有多懷疑這個功臣？）
兩種錯誤的相對成本（誤殺忠臣 vs 被叛臣推翻）

在帝制結構下，「被推翻」的成本是無限大的——失去皇位通常意味著失去生命和全家族的滅亡。因此，即使 p 很小（功臣謀反的機率很低），只要 p > 0，君主就有動機選擇「清除」。

這就解釋了為什麼「功高震主」如此危險：不是因為功臣真的想謀反，而是因為功臣的「能力」提高了 p 的感知值。一個普通將領即使有謀反之心，也沒有成功的可能；但岳飛這樣的名將，一旦謀反，成功機率遠高於常人。

4.3 多期博弈的惡化

更糟糕的是，這個博弈在時間維度上會惡化。

假設博弈每期重複。功臣每期都可以選擇「繼續效忠」或「謀反」。如果功臣是理性的，他會選擇在「最佳時機」謀反——當他的軍事力量最強、朝廷最虛弱的時候。

這意味著：功臣的軍事成功，恰恰是他可能謀反的最危險時刻。岳飛在紹興十年北伐連捷、收復失地——這正是他軍事力量的巔峰，也是趙構最恐懼的時刻。^[25]

袁崇煥的情況類似。己巳之變中，他率軍回援北京，軍隊駐紮在城外——如果他有謀反之心，這是絕佳的時機。崇禎無法確定袁崇煥會不會在關鍵時刻「倒戈」，這種不確定性本身就是致命的。

五、機制設計視角：制度如何製造悲劇

5.1 激勵不相容的制度

2007年諾貝爾經濟學獎授予了赫維茲（Hurwicz）、馬斯金（Maskin）與邁爾森（Myerson），以表彰他們在「機制設計理論」上的貢獻。^[26]

機制設計理論的核心問題是：如何設計一套規則（機制），使得參與者在追求自身利益的同時，也能實現社會整體的最優結果？一個好的機制，必須是「激勵相容」（Incentive Compatible）的——讓參與者有動機說真話、做正確的事。

從機制設計的角度看，帝制中國的功臣制度是「激勵不相容」的：

功臣的激勵是立功受賞，但功勞越大，危險越高。
君主的激勵是維護皇位，但越是能幹的功臣，威脅越大。
雙方的利益在短期內一致（打敗外敵），但在長期卻可能衝突（誰掌握權力）。

5.2 歷史上的機制創新

歷史上，不同朝代嘗試了各種機制來解決這個問題：

漢初的分封制

劉邦在立國之初大封功臣為王，試圖用「權力分享」換取忠誠。但這個機制很快失效——異姓王的存在本身就是威脅，最終劉邦和呂后將異姓王逐一清除。^[27]

宋代的「杯酒釋兵權」

趙匡胤用「談判」的方式解決了問題——用財富和尊榮換取功臣交出兵權。^[28] 這是一個相對成功的機制，但它的前提是：雙方都相信對方會遵守協議。一旦信任崩潰，機制就會失效。

明代的「錦衣衛」監控

朱元璋建立了龐大的特務系統來監控功臣。^[29] 這個機制的問題是：監控本身會引發功臣的不安，反而增加謀反的動機；而且監控機構本身也可能腐敗或被收買。

5.3 無解的困境？

從機制設計的角度看，帝制結構下的功臣問題可能是「無解」的。^[30]

原因在於：

權力的不可分割性：皇位是「贏者全拿」的，無法像企業股權那樣分割。
缺乏第三方執行：沒有獨立於皇權的司法體系來保障契約。
暴力的非對稱性：功臣通常掌握軍事力量，而皇帝的優勢在於正當性。一旦正當性受到質疑，力量對比就會逆轉。

在這種結構下，「功高震主」幾乎是必然的——不是因為功臣真的想震主，而是因為結構使得君主無法不猜忌功臣。岳飛與袁崇煥的悲劇，是這種結構性缺陷的具體呈現。

六、超越「昏君讒言」的敘事

6.1 傳統敘事的局限

傳統史觀將岳飛之死歸咎於「秦檜的讒言」與「趙構的昏庸」；將袁崇煥之死歸咎於「後金的反間計」與「崇禎的多疑」。這種敘事有其價值——它為忠臣平反，譴責奸佞——但它也有嚴重的局限。

首先，它過度強調個人因素，忽略結構因素。如果趙構換成別人，岳飛就能善終嗎？如果崇禎沒有中反間計，袁崇煥就能倖免嗎？從博弈論的分析來看，答案很可能是否定的。

其次，它隱含了一種「如果當時……」的反事實推理。但歷史不允許實驗——我們無法真正知道，在「沒有秦檜」或「沒有反間計」的平行世界中，會發生什麼。

6.2 結構性悲劇的啟示

從博弈論與經濟學的角度看，岳飛與袁崇煥的悲劇，是「結構性悲劇」——它根植於帝制結構的內在矛盾，而非僅僅是個人的道德失敗。

這種理解有幾個重要的啟示：

制度比個人重要：在一個激勵不相容的制度下，即使所有參與者都是「好人」，悲劇仍然可能發生。
信任需要機制支撐：僅僅依靠道德、誓言或情感，無法建立穩定的信任關係。可信承諾需要制度性的保障。
功高震主是結構問題：不能簡單地歸咎於君主的「昏」或功臣的「驕」。只要權力結構不變，這個問題就會反覆出現。

6.3 曾國藩的例外

在這個脈絡下，曾國藩的「功成身退」就顯得更加難能可貴。^[31]

曾國藩面臨的博弈結構與岳飛、袁崇煥類似——他也是功高震主的軍事統帥。但他做出了不同的選擇：主動裁撤湘軍、扶植後進、轉向文教。這些行動的本質，是在博弈結構不利的情況下，主動「改變博弈」——用「成本高昂的信號」（放棄軍權）來證明自己沒有異心。

曾國藩的成功，不是因為他遇到了「明君」（慈禧和恭親王同樣充滿猜忌），而是因為他理解了博弈的結構，並找到了一條可行的「均衡路徑」。岳飛與袁崇煥，或許缺乏這種博弈論的直覺——或者，他們所處的歷史條件，根本不允許他們走這條路。

結語：歷史的教訓與現代的迴響

岳飛與袁崇煥的悲劇，至今仍是中國人集體記憶中的傷痛。「莫須有」三個字，千年後讀來，依然令人齒寒；袁崇煥被凌遲時「京師百姓爭啖其肉」的場景，更是歷史的至暗時刻。

然而，從博弈論的角度重新審視這些悲劇，我們得到的不僅是「昏君」與「讒言」的道德譴責，更是對權力結構的深刻反思。在一個「激勵不相容」的制度下，忠臣的命運可能早已註定；而「功高震主」的詛咒，不是個人的道德失敗，而是結構的必然結果。

這個教訓對現代社會依然有意義。在任何組織中——企業、政府、非營利機構——當權力結構無法提供可信的承諾機制、當信息不對稱無法被有效克服、當激勵機制不相容時，類似的悲劇就可能發生。經理人與董事會、創辦人與投資人、將領與政府——這些關係中，都潛藏著類似的博弈結構。

岳飛死前，據說曾仰天長嘯：「天日昭昭！天日昭昭！」^[32] 他相信歷史會還他公道。確實，歷史最終為他平反，追諡「武穆」。但博弈論的分析告訴我們，僅僅依靠「天日昭昭」是不夠的——要避免悲劇重演，我們需要的是制度的改革，而非僅僅期待道德的昇華。

參考資料

鄧廣銘，《岳飛傳》，北京：人民出版社，1983年，頁389-410。
閻崇年，《袁崇煥傳》，北京：中華書局，2005年，頁312-315。另參考《明史·袁崇煥傳》。
Ross, S. A. (1973). The Economic Theory of Agency: The Principal's Problem. The American Economic Review, 63(2), 134-139. JSTOR
Jensen, M. C., & Meckling, W. H. (1976). Theory of the firm: Managerial behavior, agency costs and ownership structure. Journal of Financial Economics, 3(4), 305-360. https://doi.org/10.1016/0304-405X(76)90026-X
王曾瑜，《岳飛新傳》，上海人民出版社，2007年，頁189-205。
鄧廣銘前引書，頁298-312。關於「迎回二聖」口號的政治意涵，參考姚從吾，〈宋高宗與岳飛之間的猜忌〉，《中央研究院歷史語言研究所集刊》，1962年。
這種「預防性清除」的邏輯，類似於國際關係中的「預防性戰爭」理論。參考 Levy, J. S. (1987). Declining Power and the Preventive Motivation for War. World Politics, 40(1), 82-107. https://doi.org/10.2307/2010195
閻崇年前引書，頁78-95。
《明史·袁崇煥傳》：「崇煥入對，帝問方略，對曰：『方略已具疏中。臣受陛下特眷，願假以便宜，計五年，全遼可復。』」
關於擅殺毛文龍的爭議，參考李光濤，〈袁崇煥殺毛文龍之檢討〉，《中央研究院歷史語言研究所集刊》，1957年；閻崇年前引書，頁156-178。
閻崇年前引書，頁198-215。
己巳之變的詳細經過，參考樊樹志，《晚明史》，上海：復旦大學出版社，2003年，第八章。
關於崇禎對袁崇煥的信任變化，參考孟森，《明清史講義》，北京：中華書局，2006年，頁189-201。
Spence, M. (1973). Job Market Signaling. The Quarterly Journal of Economics, 87(3), 355-374. https://doi.org/10.2307/1882010
關於分離均衡的技術細節，參考 Mas-Colell, A., Whinston, M. D., & Green, J. R. (1995). Microeconomic Theory. Oxford University Press, Chapter 13.
岳飛治軍名言，見《宋史·岳飛傳》：「凍死不拆屋，餓死不擄掠。」
關於「精忠報國」刺字的真實性，學術界有不同看法。鄧廣銘認為此說可信，但也有學者質疑。參考鄧廣銘前引書，頁45-48。
王曾瑜前引書，頁215-230。
這種「能力信號」與「意圖信號」的張力，在現代企業情境中也常見。參考 Chatterjee, K., & Samuelson, W. (1983). Bargaining under Incomplete Information. Operations Research, 31(5), 835-851.
Schelling, T. C. (1960). The Strategy of Conflict. Cambridge, MA: Harvard University Press, Chapter 2.
羅爾綱，《湘軍兵志》，北京：中華書局，1984年，頁312-334。另參考本系列前文〈曾國藩功成身退的智慧〉。
這個論點與 North, D. C. (1990). Institutions, Institutional Change and Economic Performance. Cambridge University Press 的制度經濟學分析相呼應。https://doi.org/10.1017/CBO9780511808678
統計決策理論的經典文獻，參考 Wald, A. (1950). Statistical Decision Functions. New York: Wiley.
Harsanyi, J. C. (1967). Games with Incomplete Information Played by "Bayesian" Players, I–III. Management Science, 14(3), 159-182. https://doi.org/10.1287/mnsc.14.3.159
鄧廣銘前引書，頁320-345。
Nobel Prize Committee. (2007). Mechanism Design Theory: Scientific Background. Nobel Prize
司馬遷，《史記·高祖本紀》《淮陰侯列傳》。ctext.org
《宋史·太祖本紀》；另參考王育濟，《杯酒釋兵權新論》，《歷史研究》，1998年第3期。
黃仁宇，《萬曆十五年》，北京：中華書局，1982年，第一章。
這個「無解」的結論，與 Arrow, K. J. (1951). Social Choice and Individual Values. New York: Wiley 的「不可能定理」有結構上的類似性。
朱東安，《曾國藩傳》，北京：人民出版社，2008年，頁412-445。
《宋史·岳飛傳》：「飛仰天嘆曰：『天日昭昭，天日昭昭！』」

← 返回洞見列表