出版時(shí)間:2012-6 出版社:科學(xué)出版社 作者:姜殿玉
內(nèi)容概要
《帶熵博弈的局勢(shì)分析學(xué)與計(jì)策理論(上冊(cè))》在傳統(tǒng)博弈系統(tǒng)上引進(jìn)信息熵、極大熵和極小熵原理,建立了帶熵博弈論及其應(yīng)用系統(tǒng).并研究了兩個(gè)專題:一是各局中人都恰有兩個(gè)行動(dòng)的博弈中各種均衡及邊際分布是完全混合Nash 均衡的相關(guān)均衡(稱可邊際相關(guān)均衡),以及信息熵最小的可邊際相關(guān)均衡(稱為最優(yōu)局勢(shì)分布)的求解法及其應(yīng)用,二是將帶熵博弈系統(tǒng)擴(kuò)展到包含決策系統(tǒng)和經(jīng)典(帶熵)博弈系統(tǒng)作為子系統(tǒng)的公理化謀略博弈系統(tǒng),研究了這種謀略博弈系統(tǒng)的性質(zhì)和算法等.用《帶熵博弈的局勢(shì)分析學(xué)與計(jì)策理論(上冊(cè))》的理論和方法可解決傳統(tǒng)博弈論無(wú)法解決的問題,可得到由傳統(tǒng)博弈論無(wú)法得到的更優(yōu)美、精確、與實(shí)際更吻合的結(jié)果.《帶熵博弈的局勢(shì)分析學(xué)與計(jì)策理論(上冊(cè))》可供應(yīng)用數(shù)學(xué)、經(jīng)濟(jì)學(xué)、系統(tǒng)科學(xué)與系統(tǒng)工程、運(yùn)籌學(xué)、信息與控制、管理科學(xué)與工程等專業(yè)的研究生、專家學(xué)者以及相關(guān)領(lǐng)域的研究人員研究與參考.
書籍目錄
前言第0章 導(dǎo)論0.1 經(jīng)典博弈系統(tǒng)的不完備性0.2 本書的主要內(nèi)容O.3 一些初步應(yīng)用及研究?jī)r(jià)值第0章 參考文獻(xiàn)第一部分 經(jīng)典博弈論第1章 經(jīng)典矩陣博弈1.1 經(jīng)典矩陣博弈的概念1.1.1 基本成分1.1.2 基本公理1.1.3 矩陣博弈1.2 vonNeumann博弈論基本定理1.3 矩陣博弈的良策1.4 關(guān)于博弈解的幾個(gè)定理1.5 策略的優(yōu)超關(guān)系及博弈的線性規(guī)劃解法1.6 幾個(gè)特殊矩陣博弈的解法1.6.1 2×2矩陣博弈的求解1.6.2 2×n矩陣博弈的求解1.6.3 m×2矩陣博弈的求解第2章 經(jīng)典連續(xù)博弈2.1 連續(xù)博弈的基本概念2.2 連續(xù)博弈的基本定理2.3 連續(xù)博弈的解集第3章 經(jīng)典策略博弈3.1 n人策略博弈及其純:Nash均衡3.2 n人正規(guī)博弈的完全混合Nash均衡3.3 2×2雙矩陣博弈的求解3.4 策略博弈Nash均衡的不唯一性和不可交換性3.4.1 聚點(diǎn)均衡論3.4.2 廉價(jià)磋商論(cheat)talk)第1—3章 參考文獻(xiàn)第二部分 零和博弈的判斷理論第4章 矩陣博弈上的判斷理論4.1 判斷塊4.1.1 預(yù)備結(jié)果4.1.2 分塊的外面、虛面和實(shí)面及其維數(shù)4.1.3 實(shí)面的存在性4.1.4 分塊的相對(duì)邊界的構(gòu)造4.1.5 有限凸劃分下分塊的I,ebesgue可測(cè)性4.1.6 判斷塊及其凸性4.2 判斷下的良策集4.3 博弈解與判斷的關(guān)系以及其他問題第5章 連續(xù)博弈上的判斷理論5.1 判斷塊5.2 判斷下的良策集5.3 博弈解與判斷間的關(guān)系5.4 D(0,1)的擴(kuò)張閉凸集的緊策略集的相對(duì)最優(yōu)緊凸子集第4—5章 參考文獻(xiàn)第三部分 信息熵理論第6章 離散型隨機(jī)變量的信息熵理論6.1 有限博弈混合策略或判斷的不明確性與熵6.2 熵的性質(zhì)6.3 聯(lián)合熵及其性質(zhì)第7章 有限閉區(qū)間上連續(xù)型隨機(jī)變量的信息熵7.1 連續(xù)型隨機(jī)變量的概率的積分表示7.2 閉區(qū)間上連續(xù)型隨機(jī)變量的相對(duì)熵和絕對(duì)熵7.3 閉區(qū)間上連續(xù)型隨機(jī)變量的熵不等式第8章 極大熵和極小熵原理8.1 最可能先驗(yàn)概率分布——極大熵原理8.2 極小炳原理第6—8章 參考文獻(xiàn)第四部分 帶熵博弈論第9章 矩陣博弈的Neumann.Shannon博弈解9.1 矩陣博弈的:Neumann—Sha:nnc)n博弈解9.2 等均值矩陣博弈第10章 連續(xù)博弈的極大熵策略密度博弈解10.1 概率密度函數(shù)空間(或策略密度空間)的凸緊性10.2 連續(xù)博弈的良策密度空間及其凸緊性10.3 M-極大熵策略密度博弈解集10.4 極大熵策略密度的算法10.5 一類帶M-極大熵策略密度博弈解的連續(xù)博弈第11章 n人條件博弈的期望均衡及其應(yīng)用11.1 n人條件博弈的期望均衡11.2 應(yīng)用例子11.3 n人有限博弈的期望均衡11.4 在環(huán)境生態(tài)管理上的應(yīng)用11.5 自然條件下同級(jí)消費(fèi)者的平均規(guī)模附錄公共資源的悲劇第12章 有限帶熵理性博弈的純Nash均衡集和期望均衡集12.1 投影、截面和子族分解定理12.2 N-M穩(wěn)定集12.3 極大穩(wěn)定矩形12.4 L-博弈12.5 理想完全靜態(tài)博弈12.6 理想完全靜態(tài)博弈中兩個(gè)相交且不等的極大穩(wěn)定矩形的關(guān)12.7 有聚點(diǎn)博弈12.8 完全靜態(tài)博弈及其期望均衡12.9 幾個(gè)經(jīng)典例子的進(jìn)一步研究12.10 正則博弈的N-M穩(wěn)定集及其唯一存在定理第13章 一些常見雙矩陣博弈的混合Nash均衡和期望均衡分析13.1 雙矩陣博弈的混合Nash均衡與期望均衡13.2 小偷守衛(wèi)博弈13.3 窮人-富人巡邏博弈13.4 查稅-逃稅博弈13.5 軍力調(diào)撥博弈與正當(dāng)防衛(wèi)無(wú)罪的帶熵博弈論根據(jù)13.6 一類雙矩陣博弈及其在生態(tài)環(huán)境科學(xué)中的應(yīng)用13.6.1 問題的提出13.6.2 當(dāng)x為已知時(shí)幾種思想下的結(jié)論13.6.3 當(dāng)x>0為未知時(shí)的博弈結(jié)論13.6.4 在生態(tài)環(huán)境科學(xué)上的應(yīng)用第9-13章 參考文獻(xiàn)名詞索引ABSTRACTCONTENTS
章節(jié)摘錄
第0章 導(dǎo)論 0.1經(jīng)典博弈系統(tǒng)的不完備性 我們首先來(lái)回顧一下第一次數(shù)學(xué)危機(jī)的誘因。古希臘著名的Pythagoras學(xué)派一方面認(rèn)為一切數(shù)都是整數(shù)或者兩個(gè)整數(shù)之比,也就是現(xiàn)在的“有理數(shù)”;另一方面他們已經(jīng)發(fā)現(xiàn)了著名的Pythagoras定理,也就是我們所說的“勾股定理”:直角三角形斜邊的平方等于兩個(gè)直角邊的平方和。然而Pythagoras的得意門生Hippasus卻發(fā)現(xiàn):?jiǎn)挝恢苯沁叺牡妊苯侨切蔚男边厖s不能表示為兩個(gè)整數(shù)之比。正像哥白尼由于發(fā)現(xiàn)日內(nèi)心說而被地心說信徒活活燒死一樣,由于Hippasus向Pythagoras學(xué)派提出了挑戰(zhàn)而被該學(xué)派的信徒們拋入大海,然而這卻導(dǎo)致了第一次數(shù)學(xué)危機(jī)。最終歷史裁定了Pythagoras學(xué)派的錯(cuò)誤,人們通過引進(jìn)“無(wú)理數(shù)”的概念,而形成有理數(shù)集與無(wú)理數(shù)集之并集是實(shí)數(shù)集的新的觀念。這次危機(jī)使得數(shù)學(xué)前進(jìn)了一大步。從上述例子可以看出,當(dāng)某個(gè)系統(tǒng)被接受以后,人們往往認(rèn)為這種系統(tǒng)是完備的,什么對(duì)象都屬于這個(gè)系統(tǒng)。正像Pythagoras學(xué)派認(rèn)為什么數(shù)都是兩個(gè)整數(shù)之比一樣!現(xiàn)在列舉博弈論方面的幾個(gè)例子。(1)摸球博弈危機(jī):對(duì)矩陣博弈的混合良策,ThomasL.C.在文獻(xiàn)[1]中建議通過用隨機(jī)摸球法來(lái)指揮部隊(duì)前進(jìn)還是撤退。但實(shí)際上沒有一個(gè)軍事指揮官不通過偵查來(lái)判斷對(duì)手的行動(dòng),而坐在指揮所里用摸球和擲幣的方法來(lái)指揮軍事行動(dòng)。為什么由經(jīng)典博弈論建議的方法與實(shí)際情況不相符呢?我們的理論回答了這個(gè)問題:這樣的軍事博弈原本不在經(jīng)典博弈論體系之內(nèi),可是ThomasL。C。卻硬把它放在經(jīng)典博弈系統(tǒng)中,因而解釋不通!正如《孫子兵法》所說:“知彼知己,百戰(zhàn)不殆。不知彼而知己,一勝一負(fù)。不知彼不知己,每戰(zhàn)必殆?!边@與Pythagoras悖論同??!我們通過在經(jīng)典博弈系統(tǒng)上加入判斷成分,使之形成擴(kuò)展了的新系統(tǒng),則上述軍事和商戰(zhàn)博弈就在我們的系統(tǒng)之內(nèi)。如同通過將全體“無(wú)理數(shù)”添加到“有理數(shù)”集合中,從而擴(kuò)大了數(shù)系,使得單位直角邊的等腰直角三角形的斜邊長(zhǎng)度落在新的數(shù)系中 (2)性別戰(zhàn)危機(jī):有一對(duì)新婚夫婦打算一起到外面度過一個(gè)難忘的周末。丈夫喜歡看足球賽,妻子喜歡看芭蕾舞且夫婦更愿意在一起是他們的共同知識(shí)。如果不許商量并讓他們同時(shí)各自做出決策,究竟是去某足球場(chǎng)還是去某芭蕾舞劇場(chǎng),他們 應(yīng)該怎樣決策呢?眾所周知這個(gè)博弈有兩個(gè)“純Nash均衡”:一起看球或一起看芭蕾舞。但究竟會(huì)實(shí)現(xiàn)哪一個(gè)純Nash均衡呢?很多人提出了不同的方法。第一種觀點(diǎn)是通過兩人商量用抓鬮的方法把原來(lái)的非合作博弈轉(zhuǎn)化成合作博弈[1],但這違背原假定(不許商量)。第二種觀點(diǎn)[2]是“實(shí)際生活中,也許是這次看足球,下次看芭蕾舞,如此循環(huán),形成一種默契。這里還有‘先動(dòng)優(yōu)勢(shì)’,比如說,若男的買票,兩人就會(huì)出現(xiàn)在足球場(chǎng),若女的買票,兩人就會(huì)出現(xiàn)在芭蕾舞廳”。但是,前者不是一次性博弈,后者的假定多出了“先動(dòng)優(yōu)勢(shì)”且誰(shuí)買票也必須是雙方的共同知識(shí)――超出了博弈結(jié)構(gòu)中的共同知識(shí)所要求的范圍。第三種觀點(diǎn)是[1]沒有理由認(rèn)為只有某個(gè)平衡偶①才是博弈的結(jié)果??赡芙Y(jié)果也許是丈夫去芭蕾舞廳,妻子去足球場(chǎng)。就像美國(guó)小說家亨利的小說《圣誕禮物》中的丈夫用賣了自己的金表的錢給妻子買了一把精致的發(fā)梳;而妻子卻用賣掉秀發(fā)而得到的錢給丈夫買了一條金表鏈。由此可見,這些博弈結(jié)果大都來(lái)自于非數(shù)理性的“想當(dāng)然”,隨心所欲地添加條件,因此其邏輯性很不嚴(yán)密。我們的理論卻對(duì)此給出了數(shù)學(xué)上嚴(yán)格、結(jié)果上圓滿的解答:在經(jīng)典博弈系統(tǒng)中,這個(gè)問題是無(wú)解的;而如果將極大熵原理作為全體局中人的共同知識(shí)加入到經(jīng)典博弈系統(tǒng)中,而形成新的博弈系統(tǒng),那么這個(gè)問題就有解了:兩人在完全不知道對(duì)方的決策信息的情況下,只能是丈夫去足球場(chǎng),妻子去芭蕾舞劇場(chǎng)。這不但從數(shù)學(xué)上證明了文獻(xiàn)[1]中定性地提到的“沒有理由認(rèn)為只有某個(gè)平衡偶①才是博弈的結(jié)果”,而且也避免了發(fā)梳與金表鏈類悲劇發(fā)生的可能性。如果他們知道一些相關(guān)信息,他們就要么雙雙出現(xiàn)在足球場(chǎng),要么雙雙出現(xiàn)在芭蕾舞劇場(chǎng)(見本書例12.9.2)。如同單位直角邊的等腰直角三角形的斜邊長(zhǎng)度是多少在“有理數(shù)系”中無(wú)解;而在“實(shí)數(shù)系”中則有解一樣!再考慮兩個(gè)人分一塊蛋糕的博弈[2],每個(gè)人獨(dú)立地提出自己要求的份額。如果兩人所要求的份額之和不超過這塊蛋糕,則每人得到他所要的份額,否則因無(wú)法滿足他們的要求,所以誰(shuí)也得不到什么。如果將這個(gè)博弈放在經(jīng)典體系中,那么這兩個(gè)人無(wú)法實(shí)現(xiàn)兩人所要份額恰是這塊蛋糕數(shù)的Nash均衡。即在經(jīng)典博弈系統(tǒng)中,此問題無(wú)解;但若將極大熵原理作為共同知識(shí)加入到經(jīng)典系統(tǒng)中,從而形成新的博弈系統(tǒng),則此博弈就有解了――每人都要蛋糕數(shù)的一半。這樣的例子比比皆是,不再贅述了。這種例子也說明了經(jīng)典博弈論假定了局中人具有傳統(tǒng)的理性和確定的知識(shí),所以經(jīng)典博弈體系中的局中人能夠解決的問題或者形成的均衡是一定的。但將極大熵原理作為共同知識(shí)加入到傳統(tǒng)博弈體系中,就會(huì)使得局中人都變得比原來(lái)聰明。知識(shí)在現(xiàn)代博弈論中發(fā)揮著越來(lái)越重要的作用。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、著名博弈論專家Aumann教授通過公理化方法系統(tǒng)地研究了知識(shí)的語(yǔ)法結(jié)構(gòu)和語(yǔ)義結(jié) ①即純Nash均衡。――引者 0。1經(jīng)典博弈系統(tǒng)的不完備性3 構(gòu)[3.4],建立了知識(shí)的公理化體系,從而使得這個(gè)問題的研究形成一股新的潮流。讀書可增長(zhǎng)知識(shí),人的知識(shí)多了能夠解決問題或者提高解決問題的方案的質(zhì)量的可能性就大了。因此,作為理論上的“副產(chǎn)品”,我們也從數(shù)學(xué)上證明了“知識(shí)使人聰明”、“知識(shí)就是力量”等千古名言。(3)“混合策略的不明確性”不明確:文獻(xiàn)[1]指出:對(duì)于零和博弈,使用混合策略可以增加迷惑對(duì)手的不明確性。因此局中人所使用的混合最優(yōu)策略的不明確性越大越好。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主ThomasC。Schelling教授在他的關(guān)于博弈論的代表作[5]第175頁(yè)中說:“在純粹沖突博弈論也就是零和博弈論中,隨機(jī)策略扮演著核心角色??梢圆豢鋸埖卣f,隨機(jī)行為這一因素在過去的十到十五年期間里一直是博弈論研究中最為核心的問題。在二人博弈中,隨機(jī)化的實(shí)質(zhì)是為了回避對(duì)手掌握自己的行為規(guī)律,防止對(duì)手通過分析自己的行為來(lái)掌握自己的行為規(guī)律,最終達(dá)到迷惑對(duì)手的目的。”可見頂級(jí)博弈論專家們一直都在關(guān)注著“混合策略的不明確性”及其大小的問題,可是“混合策略的不明確性”的數(shù)學(xué)定義究竟是什么?究竟如何測(cè)度它?在經(jīng)典博弈論中卻沒有這種成分。在我們的理論中,將把信息論之父Shannon的信息熵[6]概念引進(jìn)經(jīng)典博弈系統(tǒng),從而構(gòu)成新的博弈系統(tǒng)――帶熵博弈論,就嚴(yán)格數(shù)學(xué)化地、圓滿地解決了上述問題。(4)“智豬博弈”[7]直觀現(xiàn)象的嚴(yán)格數(shù)學(xué)化研究:豬圈里有一大一小兩頭豬。豬圈的一邊有個(gè)踏板,另一邊有一個(gè)豬食槽。每踏一次踏板,就有一定數(shù)量的豬食流進(jìn)食槽。如果一頭豬去踏踏板,那么另一頭豬就會(huì)等在食槽邊搶先吃到豬食,而去踏踏板的豬反而后吃到豬食。一般的博弈論教科書中分析這個(gè)問題都比較膚淺。僅僅給出大小豬踏一次踏板流入食槽的豬食數(shù)量并對(duì)踏踏板所付出的成本給出固定的數(shù)量。例如在[2]中,有這樣兩種模型:(4.1)多勞不多得模型[2](17.18):踏一下踏板,10個(gè)單位的豬食進(jìn)槽,但需要支出2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃到1個(gè)單位;若小豬先到,大豬吃到6個(gè)單位,小豬吃到4個(gè)單位;若兩豬同時(shí)到,大豬吃到7個(gè)單位,小豬吃到3個(gè)單位。此時(shí)的最優(yōu)策略是大豬踏,小豬等,各得4個(gè)單位。(4.2)多勞反而少得模型[2](60.61):踏一下踏板,8個(gè)單位的豬食進(jìn)槽,但需要支出2個(gè)單位的成本。若大豬先到,大豬吃到7個(gè)單位,小豬只能吃到1個(gè)單位;若小豬先到,大豬和小豬各吃到4個(gè)單位;若兩豬同時(shí)到,大豬吃到5個(gè)單位,小豬吃到3個(gè)單位。此時(shí)的最優(yōu)策略是大豬踏,小豬等,大豬吃到4個(gè)單位,小豬吃到4個(gè)單位。下面再引用一篇網(wǎng)絡(luò)上廣泛流傳的匿名文章:“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的現(xiàn)象嗎?試試看。改變方案一:減量方案。投食僅為原來(lái)的一半分量。結(jié)果大豬小豬都不去踏踏板了。小豬去踏,大豬將會(huì)把食物吃完;大豬去踏,小豬將也會(huì)把食物吃完。誰(shuí)去踏踏板,就意味著為對(duì)方貢獻(xiàn)食物,所以誰(shuí)也不會(huì)有踏踏板的動(dòng)力了。如果目的是想讓豬們?nèi)ザ嗵ぬぐ?,這個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。改變方案二:增量方案。投食為原來(lái)的一倍分量。結(jié)果是大豬、小豬都會(huì)去踏踏板。誰(shuí)想吃,誰(shuí)就會(huì)去踏踏板。反正對(duì)方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在“共產(chǎn)主義”社會(huì),所以競(jìng)爭(zhēng)意識(shí)不會(huì)很強(qiáng)。對(duì)于游戲規(guī)則的設(shè)計(jì)者來(lái)說,這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙倍的食物);因而競(jìng)爭(zhēng)不激烈,想讓豬們?nèi)ザ嗵ぬぐ宓男Ч⒉缓谩8淖兎桨溉簻p量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近,結(jié)果多勞多得,小豬和大豬都會(huì)拼命地?fù)屩ぬぐ?。?duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案,成本不高,但收獲最大。原版的“智豬博弈”故事給了競(jìng)爭(zhēng)中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對(duì)于社會(huì)而言,因?yàn)樾∝i未能參與競(jìng)爭(zhēng),小豬搭便車時(shí)的社會(huì)資源配置并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿意看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。比如,公司的獎(jiǎng)勵(lì)力度大,有持股,有期權(quán),公司職員各個(gè)都成了百萬(wàn)富翁,成本高不說,員工的積極性也不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力了――就像“智豬博弈”減量方案所描述的情形。最好的激勵(lì)機(jī)制就像改變方案三――減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對(duì)公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。然而,以上述網(wǎng)絡(luò)文章為代表的分析屬于定性和直觀分析。也就是說,這種分析沒有揭示出這個(gè)博弈的數(shù)量關(guān)系。例如,在分別給定大豬踏小豬等待、小豬踏大豬等待、兩豬都踏和兩豬都等待時(shí),大豬和小豬各自吃到的豬食數(shù)量和付出的成本數(shù)的情況下,上述三種情況出現(xiàn)的概率究竟有多大?當(dāng)上述給定量中的某些發(fā)生變化時(shí),對(duì)上面概率的影響如何?如果給定上述概率,應(yīng)該如何設(shè)計(jì)上述數(shù)量化的激勵(lì)指標(biāo)?這是傳統(tǒng)博弈論無(wú)法解決的問題。將信息熵和極小熵與極大熵原理作為局中人的共同知識(shí)加入到傳統(tǒng)博弈論系統(tǒng)上便可得到我們新的博弈系統(tǒng),再基于Aumann的相關(guān)均衡理論,即可建立起一 0.1經(jīng)典博弈系統(tǒng)的不完備性5 門所謂的局勢(shì)分析學(xué),上述問題都可以使用局勢(shì)分析學(xué)加以解決。因此局勢(shì)分析學(xué)既可以數(shù)量化地應(yīng)用于經(jīng)濟(jì)學(xué)中的博弈激勵(lì)設(shè)計(jì),又可以預(yù)測(cè)博弈各個(gè)局勢(shì)出現(xiàn)的概率。同樣,“重金之下必有勇夫”是中國(guó)的一句格言,然而,在經(jīng)典博弈論中卻無(wú)法證明它,但是應(yīng)用局勢(shì)分析學(xué)就可以輕而易舉地給出其數(shù)學(xué)證明。(5)博弈論與東方謀略:其實(shí),博弈論早在公元前一千多年就在我國(guó)誕生了,例如姜子牙的軍事謀略等。春秋時(shí)代的《孫子兵法》更久負(fù)盛名,該書在國(guó)外也具有很大的影響,早就有日、英、法、德、俄等至少14種譯作流傳于世。第一次世界大戰(zhàn)以后,德皇威廉二世對(duì)未早日讀到《孫子兵法》而后悔不迭。日本把孫武推崇為“百世兵家之師”并把《孫子兵法》譽(yù)為“兵家圣典”(見文獻(xiàn)[8]),而且將其有效地運(yùn)用于現(xiàn)代經(jīng)濟(jì)管理的各條渠道,開創(chuàng)了“兵法經(jīng)營(yíng)學(xué)派”(見文獻(xiàn)[9])。在我國(guó)著名的兵法謀略小說《三國(guó)演義》中,諸葛亮活活氣死博弈高手周瑜,周瑜臨死時(shí)仰天長(zhǎng)嘆“既生瑜何生亮!”,也使得博弈高手司馬懿驚嘆其為蓋世奇才。事實(shí)上,諸葛亮的草船借箭、借東風(fēng)等奇計(jì)使得周瑜折服。面對(duì)司馬懿15萬(wàn)大兵壓境諸葛亮設(shè)下的空城計(jì)使得司馬懿錯(cuò)失良機(jī)。正如諸葛亮所說:“為將而不通天文,不識(shí)地利,不知奇門,不曉陰陽(yáng),不看陣圖,不明兵勢(shì),是庸才也?!敝荑ぴO(shè)反間計(jì)使蔣干傳書于曹操,借曹操之手殺了水軍都督蔡瑁、張?jiān)?;施苦肉?jì)于黃蓋,以堅(jiān)定曹操相信黃蓋投曹等計(jì)策,自以為無(wú)人知曉,但卻逃不脫諸葛亮的一雙慧眼。即諸葛亮不但善于算人,而且還善于算人之所算。上述故事說明了東方謀略化博弈中,不但有局中人,而且還有局外人(天氣、地理環(huán)境、市場(chǎng)情況等):其中局中人在博弈中不但有策略,而且還涉及其利益;局外人只有策略,而不涉及其利益。傳統(tǒng)博弈論中沒有判斷成分,而謀略化博弈論不但有每個(gè)局中人關(guān)于其他局中人的局勢(shì)判斷(一級(jí)判斷),而且還有其他局中人關(guān)于局勢(shì)判斷的判斷。直到更高級(jí)的判斷。由此可見我們的謀略化博弈系統(tǒng)是在傳統(tǒng)博弈系統(tǒng)基礎(chǔ)上加上熵的知識(shí)(包括極大熵和極小熵原理)、局外人、高級(jí)判斷系統(tǒng)等等而形成的更高級(jí)的博弈系統(tǒng)。當(dāng)把上述所加入的系統(tǒng)限制為空集時(shí),我們的系統(tǒng)就退化為經(jīng)典博弈系統(tǒng)。因此我們的新系統(tǒng)是比傳統(tǒng)博弈系統(tǒng)更大的系統(tǒng),前者是后者的升級(jí)版本,因而兩者之間是無(wú)矛盾的、兼容的。由上可知,嚴(yán)密的科學(xué)系統(tǒng)都如同數(shù)系的發(fā)展一樣。對(duì)于一定的科學(xué)系統(tǒng),必然存在著某種對(duì)象不在這個(gè)系統(tǒng)之內(nèi),這樣就需要通過擴(kuò)大系統(tǒng),而將這一類對(duì)象包含在其中。因此科學(xué)的發(fā)展將永遠(yuǎn)沒有止境。甚至根據(jù)哥德爾不完備定理的哲學(xué)意義,對(duì)于任何一種相容的科學(xué)系統(tǒng),都存在著某種對(duì)象,既不能由此系統(tǒng)推出,也不能由此系統(tǒng)得到排斥。0.2本書的主要內(nèi)容 第一部分研究本書涉及的經(jīng)典博弈論的內(nèi)容。其結(jié)果大多是作者自己自成體系的推演。第1章研究矩陣博弈理論,第2章研究連續(xù)博弈理論,第3章研究經(jīng)典策略博弈理論。通過這一部的閱讀,初學(xué)博弈論的讀者無(wú)需閱讀其他書籍,即可往下閱讀本書。特別是第3章給出的一些經(jīng)典二人雙行動(dòng)(每個(gè)局中人都恰有兩個(gè)行動(dòng))的博弈,在后面很多地方都重復(fù)出現(xiàn)。第二部分研究二人對(duì)抗博弈(即零和博弈)中的判斷問題,即局中人對(duì)于對(duì)手所用策略的概率的判斷問題。這部將為以后的博弈上的信息熵和博弈的計(jì)策理論打下基礎(chǔ)。其中第4章是關(guān)于矩陣博弈的,第5章是關(guān)于連續(xù)博弈的。第三部分研究與本書有密切關(guān)系且是本書基礎(chǔ)理論的信息熵理論。其中第6章研究了離散型隨機(jī)變量的信息熵問題,這里的基本內(nèi)容來(lái)源于傳統(tǒng)信息論中的熵論文獻(xiàn),包括熵的概念引進(jìn)與性質(zhì)。第7章研究連續(xù)型隨機(jī)變量的信息熵。作者做的主要工作是用非標(biāo)準(zhǔn)分析的思想把無(wú)窮大概念由一個(gè)“點(diǎn)”擴(kuò)展為無(wú)限集合(其中有各種各樣的無(wú)窮多個(gè)“無(wú)窮大”),并把定義在有限閉區(qū)間內(nèi)的離散型隨機(jī)變量的概率用積分形式來(lái)表示。從某種程度上將與定義在有限閉區(qū)間上的連續(xù)型隨機(jī)變量的概率統(tǒng)一起來(lái)。進(jìn)而找到有限閉區(qū)間上連續(xù)型隨機(jī)變量的相對(duì)熵和絕對(duì)熵的最小值。第8章證明了離散型隨機(jī)變量的極大熵原理,并提出了極小熵原理。第四部分是“帶熵博弈論”的基本理論。其中第9章把信息熵引進(jìn)矩陣博弈,把經(jīng)典博弈解的概念加以限制,形成使信息熵達(dá)到最大的博弈解。這種新的博弈解保持了原有博弈解的全部性質(zhì)。第10章把經(jīng)典連續(xù)博弈的結(jié)構(gòu)作了改進(jìn),形成了一種所謂策略密度博弈解。在此結(jié)構(gòu)上討論絕對(duì)熵或相對(duì)熵最大的博弈解。第11章研究一種新的博弈――條件博弈及其上的一種特殊均衡――期望均衡,把它用于有限博弈并給出了一些應(yīng)用例子。第12章研究正規(guī)博弈的純Nash均衡集和期望均衡集的實(shí)現(xiàn)性問題,并將合作博弈中由vonNeumannJ。和O。Morgenstrn給出的合作博弈分配的穩(wěn)定集的概念平移到非合作博弈的純Nash均衡集合中來(lái),得到有關(guān)N-M穩(wěn)定集的存在唯一性定理。第13章利用期望均衡和極小熵原理研究了二人雙行動(dòng)博弈的均衡分析問題。其中包括小偷,守衛(wèi)博弈、窮人,富人巡邏博弈、查稅,逃稅博弈和軍力調(diào)撥博弈與正當(dāng)防衛(wèi)無(wú)罪的帶熵博弈論根據(jù)等問題,進(jìn)一步研究了一類2×2雙矩陣博弈及其在生態(tài)環(huán)境科學(xué)中的應(yīng)用。第五部分作為帶熵博弈論的一種特殊情形,研究雙行動(dòng)(即每個(gè)局中人都恰有兩個(gè)行動(dòng))帶熵博弈的局勢(shì)分析學(xué)。在第14章中,為了便于統(tǒng)一地更為簡(jiǎn)便地研究這類博弈,我們將一般的n人雙行動(dòng)博弈中局中人的兩個(gè)行動(dòng)做0-1編號(hào),使得博弈的局勢(shì)都表示為長(zhǎng)度為n的二進(jìn)制數(shù),將這種博弈分為顯對(duì)稱、隱對(duì)稱和非對(duì)……
圖書封面
評(píng)論、評(píng)分、閱讀與下載
帶熵博弈的局勢(shì)分析學(xué)與計(jì)策理論(上冊(cè)) PDF格式下載