紹興十一年十二月二十九日(1142年1月27日),岳飛在大理寺獄中被賜死,年僅三十九歲。罪名是「莫須有」——或許有。[1] 四百八十六年後,崇禎三年八月十六日(1630年9月22日),袁崇煥在北京西市被凌遲處死,「京師百姓爭買其肉啖之」。[2] 罪名是「通敵叛國」。兩位名將,都死於他們誓死效忠的朝廷之手。傳統敘事將此歸因於昏君與奸臣——趙構聽信秦檜,崇禎中了反間計。但這種解釋過於依賴個人的「昏」與「奸」,忽略了更深層的結構性因素。當我們用博弈論的框架來分析這兩個案例時,會發現:功臣與君主之間的互動,本質上是一場信息不對稱下的重複博弈;而在某些條件下,這場博弈的均衡解,就是悲劇。

一、委託—代理問題:功臣困境的經濟學本質

1.1 當皇帝成為委託人

從經濟學的角度看,皇帝與功臣的關係,本質上是一種「委託—代理」(Principal-Agent)關係。[3] 皇帝(委託人)需要功臣(代理人)去執行某些任務——打仗、治理、維護秩序;但皇帝無法完全觀察功臣的行為與意圖,這就產生了「信息不對稱」。

委託—代理問題的核心困境在於:代理人可能利用信息優勢,追求自身利益而非委託人的利益。在企業情境中,這表現為經理人「偷懶」或「掏空公司」;在政治情境中,這表現為功臣「擁兵自重」或「謀反篡位」。

詹森(Jensen)與梅克林(Meckling)在1976年的經典論文中指出,解決委託—代理問題的方法有三:[4]

  • 監控(Monitoring):委託人投入資源監視代理人的行為。
  • 激勵(Incentive Alignment):設計薪酬結構,使代理人的利益與委託人一致。
  • 約束(Bonding):代理人主動提供擔保或接受限制,以證明自己不會背叛。

在帝制中國,這三種機制都存在嚴重的缺陷:

  • 監控的極限:皇帝身處深宮,對前線的情況高度依賴將領的奏報。信息傳遞延遲、失真,甚至被刻意操控。岳飛在前線的作戰情況,趙構能真正了解多少?
  • 激勵的困境:如何獎賞一個「功勞太大」的將領?封王?給他更多軍隊?這些獎勵本身就會增加他謀反的能力。
  • 約束的不可信:功臣如何證明自己「沒有異心」?效忠的誓言是廉價的(Cheap Talk),任何人都可以說。真正的約束需要「成本高昂的信號」,但什麼信號才足夠可信?

1.2 岳飛的「代理人」困境

岳飛面臨的,正是一個極端版本的委託—代理問題。

紹興十年(1140年),岳飛率軍北伐,連戰皆捷,收復大片失地。但他的成功本身,卻成為他最大的危機。此時的岳飛:

  • 統帥岳家軍十萬餘人,是南宋最強大的軍事力量。[5]
  • 在軍中擁有極高的個人威望,「岳家軍」之名本身就說明了軍隊的私人化傾向。
  • 公開主張「迎回二聖」——如果徽、欽二帝真的被迎回,趙構的皇位將陷入尷尬。[6]

從委託人(趙構)的角度看,岳飛的「代理人風險」極高:

  • 能力風險:岳飛有能力謀反——他的軍事實力足以挑戰中央。
  • 意圖的不可觀察:岳飛是否有謀反之心,趙構無法直接觀察,只能推測。
  • 行動的不可逆:一旦岳飛決定謀反,後果將不可挽回。

在這種情況下,「莫須有」的邏輯就變得可以理解——不是「或許有罪」,而是「或許會有風險」。從風險管理的角度,當一個人的潛在威脅足夠大,而你又無法確認他的真實意圖時,「預防性清除」就成為一種理性的選項。[7]

這不是為趙構辯護——他的決策可能是錯誤的、不道德的、甚至是愚蠢的。但這個決策並非完全「非理性」,它有其結構性的邏輯。

1.3 袁崇煥的「道德風險」

袁崇煥的案例則呈現了委託—代理問題的另一個面向:道德風險(Moral Hazard)。

天啟六年(1626年),袁崇煥在寧遠擊退努爾哈赤,一戰成名。[8] 崇禎即位後,袁崇煥被任命為薊遼督師,獲得「便宜行事」的全權。他向崇禎承諾:「五年復遼」。[9]

然而,袁崇煥在獲得全權後的行為,引發了嚴重的「道德風險」疑慮:

  • 擅殺毛文龍:崇禎元年(1628年),袁崇煥未經朝廷批准,以「十二大罪」處死東江總兵毛文龍。[10] 這一行動展示了他不受約束的權力——如果他可以擅殺一名總兵,他是否也可能對朝廷採取類似行動?
  • 私自議和:袁崇煥曾私下與後金接觸,試圖議和。[11] 這種「先斬後奏」的外交行為,讓朝廷對他的忠誠產生懷疑。
  • 己巳之變的疑點:崇禎二年(1629年),皇太極繞過袁崇煥的防線,直逼北京。袁崇煥率軍回援,但他為何沒有提前預警?為何讓敵軍通過他的防區?[12]

從委託人(崇禎)的角度看,袁崇煥的行為模式極為可疑:他獲得了極大的權力,卻以難以理解的方式使用這些權力。即使沒有後金的「反間計」,崇禎對袁崇煥的信任也已經動搖。[13]

二、信號博弈:忠誠如何證明?

2.1 斯彭斯的信號傳遞模型

2001年諾貝爾經濟學獎得主麥可·斯彭斯(Michael Spence)在1973年提出了「信號傳遞」(Signaling)模型,用以解釋信息不對稱下的市場行為。[14]

斯彭斯的核心洞見是:當信息不對稱存在時,擁有私人信息的一方可以透過「成本高昂的行動」來傳遞可信的信號。例如,求職者透過獲取學歷(一個耗時耗財的過程)來向雇主證明自己的能力;企業透過高額的廣告投入來向消費者證明產品質量。

信號要有效,必須滿足一個關鍵條件:分離均衡(Separating Equilibrium)——不同類型的人,發送同一信號的成本必須不同。如果忠臣和叛臣發送「忠誠信號」的成本相同,那麼這個信號就沒有區分能力。[15]

2.2 「忠誠信號」的失敗

岳飛與袁崇煥的悲劇,可以理解為「信號傳遞失敗」。

岳飛試圖發送的忠誠信號包括:

  • 多次請辭,表示無意戀棧權位。
  • 紀律嚴明的治軍風格——「凍死不拆屋,餓死不擄掠」。[16]
  • 「精忠報國」的背刺——字面意義上的「以身相許」。[17]

然而,這些信號都不足以形成「分離均衡」:

  • 請辭是廉價的:任何有野心的人都可以假裝謙讓,等待更好的時機。歷史上,曹操「三讓」丞相之位,王莽「三讓」帝位,都是先例。
  • 治軍嚴明可以是策略:一個意圖謀反的將領,同樣會維持軍紀以增強戰鬥力。
  • 紋身無法證明意圖:背刺「精忠報國」是一次性的行為,無法證明未來的持續忠誠。

更糟糕的是,岳飛的某些行為發送了相反的信號:

  • 「岳家軍」的名稱暗示軍隊的私人化。
  • 多次抗命——紹興七年(1137年),岳飛因對和議不滿,曾擅自離軍,返回廬山為母守孝。[18]
  • 「迎回二聖」的口號——無論岳飛的本意為何,這句口號在客觀上威脅了趙構的皇位正當性。

2.3 袁崇煥的混合信號

袁崇煥的信號傳遞更加混亂。

一方面,他發送了強烈的「能力信號」:

  • 寧遠大捷證明他是明朝最能打的將領。
  • 「五年復遼」的承諾展示了他的雄心與自信。

另一方面,他的行為卻發送了矛盾的「意圖信號」:

  • 擅殺毛文龍展示了他不受控制的傾向。
  • 私下議和暗示他可能有自己的議程。
  • 己巳之變中的可疑表現——究竟是能力不足,還是有意縱敵?

從信號理論的角度看,袁崇煥陷入了一個悖論:他的「能力信號」越強,他的「意圖信號」就越重要;但他的行為卻讓「意圖信號」變得模糊甚至負面。[19]

三、可信承諾問題:為什麼「誓言」不夠?

3.1 謝林的承諾理論

2005年諾貝爾經濟學獎得主湯瑪斯·謝林(Thomas Schelling)在其經典著作《衝突的策略》中,深入分析了「承諾」(Commitment)的問題。[20]

謝林指出,在戰略互動中,「承諾」要有效,必須是「可信的」(Credible)。一個可信的承諾,必須讓違反承諾的成本高於遵守承諾的成本。口頭的誓言、情感的表白,都不足以構成可信承諾——因為事後違反的成本太低。

可信承諾的典型機制包括:

  • 人質(Hostage):將有價值的東西置於對方控制之下。例如,古代諸侯送質子到天子處。
  • 燒毀橋樑:消除自己的退路,使違約成為不可能或極端昂貴。
  • 聲譽機制:在重複博弈中,違約會損害聲譽,影響未來的合作機會。
  • 第三方強制執行:引入有能力懲罰違約者的第三方。

3.2 功臣的承諾困境

岳飛與袁崇煥面臨的核心問題是:他們無法建立可信的「不謀反」承諾。

讓我們逐一檢視可能的承諾機制:

人質機制

岳飛的家眷確實在朝廷控制之下。但人質機制的有效性取決於功臣對家眷的重視程度——一個足夠冷血的野心家,可能願意犧牲家人換取帝位。趙構無法確定岳飛屬於哪一種人。

燒毀橋樑

功臣如何「燒毀」自己謀反的能力?唯一的方法是放棄兵權——但這恰恰是功臣最有價值的資產。曾國藩選擇了這條路(裁撤湘軍),[21]但岳飛與袁崇煥都是在戰爭尚未結束時被處理,他們沒有「裁軍」的時機。

聲譽機制

聲譽機制需要重複博弈的預期——「如果我這次違約,未來就沒人會信任我」。但對於一個考慮謀反的功臣而言,謀反是一次性的博弈——如果成功,他就成了皇帝,不需要別人的「信任」;如果失敗,他就死了,聲譽毫無意義。因此,聲譽機制對防止謀反無效。

第三方強制執行

在帝制中國,沒有任何第三方有能力「強制執行」功臣的忠誠承諾。皇帝本身就是最高權力,沒有更高的權威可以訴諸。

結論是:在帝制結構下,功臣無法建立可信的「不謀反」承諾。這不是岳飛或袁崇煥的個人失敗,而是制度結構的必然結果。[22]

四、囚徒困境:功臣與君主的悲劇博弈

4.1 不完全信息下的互動

讓我們將功臣與君主的互動模型化為一個博弈。

假設功臣有兩種類型:「忠臣」和「潛在叛臣」。這是功臣的私人信息,君主無法直接觀察。君主也有兩種策略:「信任」或「清除」。

博弈的報酬結構如下:

  • 如果功臣是忠臣,君主選擇信任 → 雙方都受益(功臣繼續效力,君主獲得忠誠的服務)
  • 如果功臣是忠臣,君主選擇清除 → 君主承擔道德成本和能力損失,功臣被冤殺
  • 如果功臣是潛在叛臣,君主選擇信任 → 功臣可能謀反,君主面臨巨大風險
  • 如果功臣是潛在叛臣,君主選擇清除 → 君主避免了風險,功臣被消滅

在這個博弈中,君主面臨的是一個「統計決策」問題。[23] 他需要在「誤殺忠臣」(Type I Error)和「放過叛臣」(Type II Error)之間權衡。

4.2 貝葉斯均衡分析

從貝葉斯博弈(Bayesian Game)的角度分析:[24]

設 p 為功臣是「潛在叛臣」的先驗機率。君主的決策取決於:

  • p 的大小(他有多懷疑這個功臣?)
  • 兩種錯誤的相對成本(誤殺忠臣 vs 被叛臣推翻)

在帝制結構下,「被推翻」的成本是無限大的——失去皇位通常意味著失去生命和全家族的滅亡。因此,即使 p 很小(功臣謀反的機率很低),只要 p > 0,君主就有動機選擇「清除」。

這就解釋了為什麼「功高震主」如此危險:不是因為功臣真的想謀反,而是因為功臣的「能力」提高了 p 的感知值。一個普通將領即使有謀反之心,也沒有成功的可能;但岳飛這樣的名將,一旦謀反,成功機率遠高於常人。

4.3 多期博弈的惡化

更糟糕的是,這個博弈在時間維度上會惡化。

假設博弈每期重複。功臣每期都可以選擇「繼續效忠」或「謀反」。如果功臣是理性的,他會選擇在「最佳時機」謀反——當他的軍事力量最強、朝廷最虛弱的時候。

這意味著:功臣的軍事成功,恰恰是他可能謀反的最危險時刻。岳飛在紹興十年北伐連捷、收復失地——這正是他軍事力量的巔峰,也是趙構最恐懼的時刻。[25]

袁崇煥的情況類似。己巳之變中,他率軍回援北京,軍隊駐紮在城外——如果他有謀反之心,這是絕佳的時機。崇禎無法確定袁崇煥會不會在關鍵時刻「倒戈」,這種不確定性本身就是致命的。

五、機制設計視角:制度如何製造悲劇

5.1 激勵不相容的制度

2007年諾貝爾經濟學獎授予了赫維茲(Hurwicz)、馬斯金(Maskin)與邁爾森(Myerson),以表彰他們在「機制設計理論」上的貢獻。[26]

機制設計理論的核心問題是:如何設計一套規則(機制),使得參與者在追求自身利益的同時,也能實現社會整體的最優結果?一個好的機制,必須是「激勵相容」(Incentive Compatible)的——讓參與者有動機說真話、做正確的事。

從機制設計的角度看,帝制中國的功臣制度是「激勵不相容」的:

  • 功臣的激勵是立功受賞,但功勞越大,危險越高。
  • 君主的激勵是維護皇位,但越是能幹的功臣,威脅越大。
  • 雙方的利益在短期內一致(打敗外敵),但在長期卻可能衝突(誰掌握權力)。

5.2 歷史上的機制創新

歷史上,不同朝代嘗試了各種機制來解決這個問題:

漢初的分封制

劉邦在立國之初大封功臣為王,試圖用「權力分享」換取忠誠。但這個機制很快失效——異姓王的存在本身就是威脅,最終劉邦和呂后將異姓王逐一清除。[27]

宋代的「杯酒釋兵權」

趙匡胤用「談判」的方式解決了問題——用財富和尊榮換取功臣交出兵權。[28] 這是一個相對成功的機制,但它的前提是:雙方都相信對方會遵守協議。一旦信任崩潰,機制就會失效。

明代的「錦衣衛」監控

朱元璋建立了龐大的特務系統來監控功臣。[29] 這個機制的問題是:監控本身會引發功臣的不安,反而增加謀反的動機;而且監控機構本身也可能腐敗或被收買。

5.3 無解的困境?

從機制設計的角度看,帝制結構下的功臣問題可能是「無解」的。[30]

原因在於:

  • 權力的不可分割性:皇位是「贏者全拿」的,無法像企業股權那樣分割。
  • 缺乏第三方執行:沒有獨立於皇權的司法體系來保障契約。
  • 暴力的非對稱性:功臣通常掌握軍事力量,而皇帝的優勢在於正當性。一旦正當性受到質疑,力量對比就會逆轉。

在這種結構下,「功高震主」幾乎是必然的——不是因為功臣真的想震主,而是因為結構使得君主無法不猜忌功臣。岳飛與袁崇煥的悲劇,是這種結構性缺陷的具體呈現。

六、超越「昏君讒言」的敘事

6.1 傳統敘事的局限

傳統史觀將岳飛之死歸咎於「秦檜的讒言」與「趙構的昏庸」;將袁崇煥之死歸咎於「後金的反間計」與「崇禎的多疑」。這種敘事有其價值——它為忠臣平反,譴責奸佞——但它也有嚴重的局限。

首先,它過度強調個人因素,忽略結構因素。如果趙構換成別人,岳飛就能善終嗎?如果崇禎沒有中反間計,袁崇煥就能倖免嗎?從博弈論的分析來看,答案很可能是否定的。

其次,它隱含了一種「如果當時……」的反事實推理。但歷史不允許實驗——我們無法真正知道,在「沒有秦檜」或「沒有反間計」的平行世界中,會發生什麼。

6.2 結構性悲劇的啟示

從博弈論與經濟學的角度看,岳飛與袁崇煥的悲劇,是「結構性悲劇」——它根植於帝制結構的內在矛盾,而非僅僅是個人的道德失敗。

這種理解有幾個重要的啟示:

  • 制度比個人重要:在一個激勵不相容的制度下,即使所有參與者都是「好人」,悲劇仍然可能發生。
  • 信任需要機制支撐:僅僅依靠道德、誓言或情感,無法建立穩定的信任關係。可信承諾需要制度性的保障。
  • 功高震主是結構問題:不能簡單地歸咎於君主的「昏」或功臣的「驕」。只要權力結構不變,這個問題就會反覆出現。

6.3 曾國藩的例外

在這個脈絡下,曾國藩的「功成身退」就顯得更加難能可貴。[31]

曾國藩面臨的博弈結構與岳飛、袁崇煥類似——他也是功高震主的軍事統帥。但他做出了不同的選擇:主動裁撤湘軍、扶植後進、轉向文教。這些行動的本質,是在博弈結構不利的情況下,主動「改變博弈」——用「成本高昂的信號」(放棄軍權)來證明自己沒有異心。

曾國藩的成功,不是因為他遇到了「明君」(慈禧和恭親王同樣充滿猜忌),而是因為他理解了博弈的結構,並找到了一條可行的「均衡路徑」。岳飛與袁崇煥,或許缺乏這種博弈論的直覺——或者,他們所處的歷史條件,根本不允許他們走這條路。

結語:歷史的教訓與現代的迴響

岳飛與袁崇煥的悲劇,至今仍是中國人集體記憶中的傷痛。「莫須有」三個字,千年後讀來,依然令人齒寒;袁崇煥被凌遲時「京師百姓爭啖其肉」的場景,更是歷史的至暗時刻。

然而,從博弈論的角度重新審視這些悲劇,我們得到的不僅是「昏君」與「讒言」的道德譴責,更是對權力結構的深刻反思。在一個「激勵不相容」的制度下,忠臣的命運可能早已註定;而「功高震主」的詛咒,不是個人的道德失敗,而是結構的必然結果。

這個教訓對現代社會依然有意義。在任何組織中——企業、政府、非營利機構——當權力結構無法提供可信的承諾機制、當信息不對稱無法被有效克服、當激勵機制不相容時,類似的悲劇就可能發生。經理人與董事會、創辦人與投資人、將領與政府——這些關係中,都潛藏著類似的博弈結構。

岳飛死前,據說曾仰天長嘯:「天日昭昭!天日昭昭!」[32] 他相信歷史會還他公道。確實,歷史最終為他平反,追諡「武穆」。但博弈論的分析告訴我們,僅僅依靠「天日昭昭」是不夠的——要避免悲劇重演,我們需要的是制度的改革,而非僅僅期待道德的昇華。

參考資料

  1. 鄧廣銘,《岳飛傳》,北京:人民出版社,1983年,頁389-410。
  2. 閻崇年,《袁崇煥傳》,北京:中華書局,2005年,頁312-315。另參考《明史·袁崇煥傳》。
  3. Ross, S. A. (1973). The Economic Theory of Agency: The Principal's Problem. The American Economic Review, 63(2), 134-139. JSTOR
  4. Jensen, M. C., & Meckling, W. H. (1976). Theory of the firm: Managerial behavior, agency costs and ownership structure. Journal of Financial Economics, 3(4), 305-360. https://doi.org/10.1016/0304-405X(76)90026-X
  5. 王曾瑜,《岳飛新傳》,上海人民出版社,2007年,頁189-205。
  6. 鄧廣銘前引書,頁298-312。關於「迎回二聖」口號的政治意涵,參考姚從吾,〈宋高宗與岳飛之間的猜忌〉,《中央研究院歷史語言研究所集刊》,1962年。
  7. 這種「預防性清除」的邏輯,類似於國際關係中的「預防性戰爭」理論。參考 Levy, J. S. (1987). Declining Power and the Preventive Motivation for War. World Politics, 40(1), 82-107. https://doi.org/10.2307/2010195
  8. 閻崇年前引書,頁78-95。
  9. 《明史·袁崇煥傳》:「崇煥入對,帝問方略,對曰:『方略已具疏中。臣受陛下特眷,願假以便宜,計五年,全遼可復。』」
  10. 關於擅殺毛文龍的爭議,參考李光濤,〈袁崇煥殺毛文龍之檢討〉,《中央研究院歷史語言研究所集刊》,1957年;閻崇年前引書,頁156-178。
  11. 閻崇年前引書,頁198-215。
  12. 己巳之變的詳細經過,參考樊樹志,《晚明史》,上海:復旦大學出版社,2003年,第八章。
  13. 關於崇禎對袁崇煥的信任變化,參考孟森,《明清史講義》,北京:中華書局,2006年,頁189-201。
  14. Spence, M. (1973). Job Market Signaling. The Quarterly Journal of Economics, 87(3), 355-374. https://doi.org/10.2307/1882010
  15. 關於分離均衡的技術細節,參考 Mas-Colell, A., Whinston, M. D., & Green, J. R. (1995). Microeconomic Theory. Oxford University Press, Chapter 13.
  16. 岳飛治軍名言,見《宋史·岳飛傳》:「凍死不拆屋,餓死不擄掠。」
  17. 關於「精忠報國」刺字的真實性,學術界有不同看法。鄧廣銘認為此說可信,但也有學者質疑。參考鄧廣銘前引書,頁45-48。
  18. 王曾瑜前引書,頁215-230。
  19. 這種「能力信號」與「意圖信號」的張力,在現代企業情境中也常見。參考 Chatterjee, K., & Samuelson, W. (1983). Bargaining under Incomplete Information. Operations Research, 31(5), 835-851.
  20. Schelling, T. C. (1960). The Strategy of Conflict. Cambridge, MA: Harvard University Press, Chapter 2.
  21. 羅爾綱,《湘軍兵志》,北京:中華書局,1984年,頁312-334。另參考本系列前文〈曾國藩功成身退的智慧〉。
  22. 這個論點與 North, D. C. (1990). Institutions, Institutional Change and Economic Performance. Cambridge University Press 的制度經濟學分析相呼應。https://doi.org/10.1017/CBO9780511808678
  23. 統計決策理論的經典文獻,參考 Wald, A. (1950). Statistical Decision Functions. New York: Wiley.
  24. Harsanyi, J. C. (1967). Games with Incomplete Information Played by "Bayesian" Players, I–III. Management Science, 14(3), 159-182. https://doi.org/10.1287/mnsc.14.3.159
  25. 鄧廣銘前引書,頁320-345。
  26. Nobel Prize Committee. (2007). Mechanism Design Theory: Scientific Background. Nobel Prize
  27. 司馬遷,《史記·高祖本紀》《淮陰侯列傳》。ctext.org
  28. 《宋史·太祖本紀》;另參考王育濟,《杯酒釋兵權新論》,《歷史研究》,1998年第3期。
  29. 黃仁宇,《萬曆十五年》,北京:中華書局,1982年,第一章。
  30. 這個「無解」的結論,與 Arrow, K. J. (1951). Social Choice and Individual Values. New York: Wiley 的「不可能定理」有結構上的類似性。
  31. 朱東安,《曾國藩傳》,北京:人民出版社,2008年,頁412-445。
  32. 《宋史·岳飛傳》:「飛仰天嘆曰:『天日昭昭,天日昭昭!』」