博弈论读后感

2015年11月19日作文大全

篇一:博弈论读后感

上次讲了几种同时行动博弈,其中的一种就是协调博弈。这一次专门讲协调博弈中的一种非常值得关注的情况:大规模协调博弈。在协调博弈中,局中人必须同时采取行动才能实现效用的最大化。而在大规模的协调博弈中存在一种网络的外部性,也就是是指拥有产品的人越多,这种产品的价值就越高。

当一种产品被赋予某种交流与流通的功能的时候,它常常就会具有这种外部性。比如说电话。如果只有你自己有电话,而你认识的人都没有,那电话对于你就只是一个摆设,什么用处都没有。而你周围使用电话的人越多,这部电话所起的作用就越大。我早先使用QQ的时候也是如此。那时候我是周围最早申请QQ号的,可是申请了之后却不知道和谁聊天,只好见到一个在线的就加上。到后来同学都开始用QQ了,QQ才开始成为我一个重要的联络工具。现在做科研的估计都会说微软的东西很难用,不管是操作系统还是office软件,我也很想学Linux,学TeX,但是一想到工作中别人用的都是windows和word,很多软件只有windows版本的,我用个TeX写的东西别人还打开不了,于是只好作罢。网络的外部性使得一个新的用户在选择产品的时候不光要考虑这个产品本身的好坏,还得考虑这个产品被使用的广泛性。

这种网络外部性的存在使得市场的先进入者具有后进入者不可比拟的优势。当一个具有交流功能的产品真正流通起来以后想打倒它是一件很困难的事情,比如你很难想象百度hi会取代腾讯QQ的领先地位。网络的外部性会长期的保护领先者的地位,因此,这类产品,进入市场的时候就应该不惜代价扩大用户群,以获取领先地位。有一种说法说盗版帮助了微软,没有盗版就没有微软如今在中国市场上的垄断地位,而微软一定程度上默许了盗版的泛滥,因为这对建立微软的市场地位是有利的,网络的外部性也终将会弥补微软因为盗版受到的损失。到如今微软在中国已经竖立起了垄断地位,对盗版的打击力度便开始加大,频频对政府施压,要求政府采取措施。

面对网络外部性,市场的后进者也并非是全无办法,但通常的办法都是比较消极的,以求避开外部性壁垒。这其中最常见的一种办法是使自己的产品与先进入者的产品兼容,这样就能够共享网络的外部性。例如AMD所制造的CPU在功能上就几乎和Intel的没什么两样,从而得以抢到Intel的一小块市场。这种方法有很大的局限性,因为后进者并不能完全获得先进入者产品全部的技术参数,这种兼容肯定不是完全的。还有一种办法是瞄准剩余市场。在先入者势力不及的地方开辟敌后根据地,以求将来能够农村包围城市。例如苹果在小学生使用的个人电脑上占有相当大的市场份额。

相比之下,中国移动采取了一种相对主动的办法。它开发出了与手机号码绑定的TM产品Fetion,希望能够利用自身在移动通信上的网络外部性来挑战QQ在传统的TM上的网络外部性。至于效果如何,目前我还不知道,:(

网络的外部性也不是坚不可摧的,至少在计算机领域,计算机产品的快速淘汰会限制网络外部性的好处。如果你的公司开发了一种新的计算机,而且不想使用现有的软件,但是你能够让软件公司相信你的计算机能够一炮走红,他们就会愿意编写新的软件让你的计算机使用。另外,技术的快速进步带来的向后兼容性问题也会对目前的领先者造成挑战。兼容性的要求使得微软和因特尔的产品非常的臃肿,而新的进入者反而没有这些的束缚,因而可以提供更小巧灵活的产品。看起来向后兼容性像是一个幸福烦恼

篇二:博弈论读后感

近日整理橱时,我偶然看到了在东北财经大学学习研究生课程时所学的《博弈论》这本书。当时我们很幸运,学院特意选了东北财经大学优秀教师 史永东 教授来讲授这门课。 史 教授是当时东北财经大学最年轻的教授(时年 35 岁, 32 岁时就破格晋升为教授),他把 一门很深的学问给我们讲得惟妙惟肖,非常生动。直至今日随手翻阅时,仍能清楚地记起他讲课时激情洋溢的风采,但如今重新阅读这本书却有了不同的感受,当时是为了掌握其中的理论,现在则可以比较从容地去体会其中的道理了。

博弈论是一门很深的学问,主要研究个体如何在错综复杂的相互影响中得出最合理的策略,其应用的领域也非常广,最通常的应用该是经济学吧。这本书中的理论很深奥,其数学模型的推导更是复杂,然而书中的案例却既浅显又生动,很值得一看。现在拿出一个例子来,和大家一起分析其中的道理、分享其中的趣味。

这个例子是“智猪博弈”的故事,讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。

这个故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

书中还有很多例子,并进行了分析,我们都能悟出些道理。所以读的时候会有一个感觉,那就是先有事实,后由理论。也就是我们常说的理论来源于实践。感觉就像是先有这个社会现象,然后才有这个理论去分析,这个理论套在这个社会现象上恰好合适。

篇三:博弈论读后感

博弈小术语: 收益矩阵、均衡、纳什均衡、零和

博弈论,也称互动的决策论。它的基本假设之一是人是理性的。但现实并非如此,人不可能具有完备的知识也不可能时时理性。尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。

每一次的人际交往都可以简化成两个基本选择:合作或背叛。比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。当一次性博弈出现时,人们往往会选择背叛。这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。而当博弈的终点不可知时,就又是另一回事了。

在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。

当然,如果在开头就有一些“善意”的人出来表明合作态度对提高合作机会也是有帮助的,不管这些“善意”的人是出于何种目的。一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。至于时间的长短,关键是看博弈的终点是否明确。这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。如此反复推演,合作从一开始就很难形成。注意上面的论述是基于没有惩罚机制的基础。

有一个很有意思的实验,是由克斯罗德完成的。这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。结果表明,“前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是“一报还一报策略”。

这个实力不凡的“一报还一报策略”就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。这种策略体现的是“善良、可激怒、宽容、简单”等好品质。虽然该策略在每次对局中分数都不能超过对手,但它的总分却是最高的。它赖以生存的基础很牢固。而那个非善意程序的成功是建立在别人的失败之上。可以想像,如果赋予这些程序以进化的基因,久而久之,非善意程序的存活率将下降。

篇四:博弈论读后感

我阅读的书是《博弈论教程》,王则柯、李杰编著,中国人民大学出版社。此书一共分为九章,我自学了前七章,总结了一下学习心得。

博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。

同时决策博弈

纳什均衡:局中人单独改变策略不会得到好处的对局即策略组合,就是纳什均衡。设 是 人博弈 的一个策略组合。如果对于每个局中人 , ,对于所有的 都成立,则我们称策略组合 是该博弈的一个纳什均衡。

优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。

混合策略纳什均衡

对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。

混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。

混合策略:有一个有N个局中人参与的策略式博弈 中,假定局中人 有 个纯策略,即 则概率分布 ,其中 , ,称为局中人 的一个混合策略,这里 表示局中人 选择纯策略 的概率。

混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:

1 ,对于任意的

2 ,对于任意的

利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。

帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。

序贯决策博弈

序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了“先动优势”和“后动优势”的概念,摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。

利用倒推法寻找序贯决策博弈的纳什均衡。

同时博弈与序贯博弈

子博弈:在一个 人展开型博弈 中,满足如下3个条件的一个博弈 ,称为 的一个子博弈:(1) 的博弈树是 的博弈树的一支;(2)博弈 不能分割博弈 的信息集,具体来说,只要博弈 的某个信息集的任何一个决策节点是博弈 的一个决策节点,那么博弈 的这个信息集的每一个决策节点都必须是博弈 的决策节点;(3)博弈 的末端节点处的支付向量,与博弈 在这些末端节点上的支付向量的有关部分重合。

重复博弈和策略性行动

子博弈精练纳什均衡:令 表示阶段博弈, 是 重复 次的重复博弈, ,如果 有唯一的纳什均衡,那么重复博弈 的唯一的子博弈精练纳什均衡结果,是阶段博弈 的纳什均衡重复 次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。

对于无限次重复的囚徒困境博弈,存在触发策略,两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。

对手是否采取背叛策略,取决于有效收益率 。

零和博弈

零和博弈又称“零和游戏”,与非零和博弈相对,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。

寻求二人零和博弈的纯策略纳什均衡,可以采用相对优势策略划线法,也可以采用最小最大法,最小最大法依托的思想是:局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度,行局中人采用maximin的决策原则,列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。

篇五:博弈论读后感

博弈论是一门深奥的学科,对于哲学家来说它是哲学,对于军事家来说它是一本兵书,对于文学家来说它是另一个《浮士德》,这就是博弈论。

我喜欢博弈论,因为我喜欢思考,喜欢斗争,不喜欢平静,我渴望从博弈论中找到我想要的东西,我渴望博弈论给我迷茫的心指引一条光明之路。

我读博弈论,虽然懂得准确来说不是很多,但大致的意思我还是明白的。博弈论准确来说不是一门知识,而是教会了我们如何去思考的工具,它是一种工具,让我们在解决任何事的时候都讲究策略,讲求科学,而不是凭感觉和直觉,博弈论让我们在一条路上走的更远,更久。

博弈论同样可以让人成长,让人在面对任何事的时候,都变得理智科学,做任何事都有了理论依据。它让我们在做决定时有了方向,不再迷茫。

博弈论没有出奇制胜的法宝,没有石破天惊的策略;它是平凡无奇的,又是那么让人着迷,因为它会让任何一个读它的人有所收获,不会徒劳而归。他就像一位无私的人民教师,对待她的每一位学生一视同仁。每一个读博弈论的人都应该怀着一颗庄重的心,因为它在教诲着我们!

真的希望更多的人能发现博弈论的美,让博弈论引领更多的人走向希望,走向成功!

篇六:博弈论读后感

优势策略与严格愚蠢策略

首先考虑最简单的一种情况,那就是不管别人怎么做,你都应该采取同一种策略。无论在哪种情况下采取这种策略给你带来的效用都超过采用其他策略给你带来的效用。这种策略就叫做优势策略(dominant strategy)。

以下图所示一个汽车价格博弈的可能模型为例。

打折

不打折

打折

低利润,中利润

高利润,低利润

不打折

零利润,高利润

零利润,低利润

打折对两家公司来说都是优势策略,因为打折总会带来较高的利润。

那么开车靠路的右边是不是优势策略呢?不是,只有当别人都靠右行的时候你才该这样做,如果别人开车都走左边,你最好也走左边。避免触电是不是一种优势策略呢?是的,因为不管别人怎么做,你都该坚持这一条,哪怕在某个奇怪的地方所有的人都爱用电来电自己。

与优势策略相对应的是严格愚蠢策略(strictly stupid strategy)。无论你的对手怎么做,这个策略给你带来的效用总是比你的其他策略少。显然,如果在一个博弈中,你只有两种策略,而且其中一种是优势策略,那么另一种一定是严格愚蠢策略。

在同时行动博弈中,存在优势策略或严格愚蠢策略的一方可以利用这两者策略来进行决策,而另一方则可以据此对预测对手将采取的决策,或者排除对手可能采取的某种决策。

2.协调博弈(coordination game)

具有优势策略或者严格愚蠢策略的博弈通常都很容易解决,但是除此之外的其他博弈就不是那么简单了。在这里我们首先来看协调博弈。在这种博弈中,参与双方的效用会同时达到最大,因此,如果双方同时采取对应的策略,那么双方都会得益,如果不是,那么双方都不能得到最大的收益。

显然,约会的双方都希望在同一个时间出现在同一个地点,而两家电影院也不希望在同一天推出强档影片。在这种博弈中,参与者需要彼此协调双方的行动,并且完全信任对方所说的话,因为对任何一方而言,隐瞒或者欺骗都是不明智的。因此,在协调博弈中,成功的关键在于公开、诚实与信任。

在博弈论中,判断一个人是否诚实,是否值得信任,要看诚实是否对他有利。但是现实中的人总不会是这么理性的,其中常常会掺入情感的因素。这也就是说,即使是双方共同采取行动对某一方能够带来更大的效用,他可有可能并不这么去做。这个时候就面临着信任博弈(trust game)的问题。

例如你的老板不能同时失去你和你的同事。这个时候如果你们同时要求加薪,老板就会答应你们。但是如果你们两人只有一个人试图争取加薪,那么老板就会炒掉他。如果你和你的同事都是理性的,那么你可以信任你的同事做出的和你同时要求加薪的承诺。但是,如果他和你有过什么矛盾,你就不一定能够那么信任他:说不定他在撒谎,好让老板把你赶走。在这里面让人犯愁的是你的同事可能是个笑面虎,你从你们之间的表面关系并不能有把握的推断他会怎么做,因而在这种情况下你可能会采取稳妥一点的办法,不要求加薪。相应的,即使你们之前没有明显的矛盾,你的同事可能也会对你有所怀疑,使得本来对你们两人都有利的事情泡汤。

在信任博弈中,怀疑是致命的,即使是怀疑别人心存疑虑也会造成麻烦。

3.猜硬币博弈(outguessing game)

协调博弈的反面是猜硬币博弈。在这个博弈中,甲乙两人要同时选择硬币的正面还是反面,并分别写下自己的选择。如果两人的选择一样,那么甲获胜,如果不一样,那么乙获胜。这种博弈和协调博弈的区别是协调博弈的双方的效用同时达到最大值,而在猜硬币博弈中则是一方达到最大值另一方必然达到最小值。

如果在写下自己的选择之前,双方可以交流彼此的决策。如果你是乙,想选正面,你肯定会告诉甲你要选的是反面,这样他就会也选反面,这样你就赢了。问题是甲也不笨,他也知道你不会轻易的说出自己真正的选择的。于是两人就会开始欺骗和反欺骗的游戏。

在战争中经常会出现这种博弈。二战中盟军想从诺曼底登陆,但是要千方百计的隐瞒真正的登陆地点,而德军却要千方百计的找出盟军的登陆地点,好提前部署兵力,做出准备。盟军放出各种假消息,并在其他地方营造出一种大兵团登陆的假象,最后成功的迷惑了德军。

在漆黑的夜晚开车走在十字路口,把灯关掉使别的驾驶员猜不到你的想法是一件很危险的事情,但是在猜硬币博弈中,你一定想把灯关掉。这是因为在协调博弈中,让对手知道你的做法对你有利,而在猜硬币博弈中,隐瞒行动对自己更为有利。在猜硬币博弈中,取胜的关键就在于欺骗和隐瞒。

4.斗鸡博弈(game of chichen)

在另外的一种博弈中,如果双方同时采取对应的策略,那么双方的效用会同时达到最小值。

在这方面最明显的一个例子就是过独木桥。《天龙八部》里面的风波恶和一个跳着大粪的农人在独木桥上相遇。如果两人都不想让,那就只能相持不下,或者掉到河里。一方退缩是另一方最好的结果,但是谁让谁就输了,这两人脾气都很倔,都不愿意相让,最后在桥上相持了几个时辰,最后以农人支撑不下去了而告终。

在斗鸡博弈中,只要让对手相信你绝不会退让,你就可以获胜。这种博弈比的不仅仅是谁更像男子汉,还包括谁更能表现出男子汉气概,而且神经不正常的人占有很大的优势,因为正常人不会愿意和疯子一般见识。在上面的例子里,如果农人事先知道自己面对的是风波恶这样的BT,估计一开始就会打退堂鼓,这样风波恶也不用那几个时辰证明自己,就能兵不血刃的取得胜利。

在生活中,搭便车的问题很可能会形成斗鸡博弈。 如果老板让两个人一起去完成某项任务。如果两人都卖力干活,任务就能完成,他们都可以得到10个单位的效用。如果两个人都不干活,任务完不成,那他们都会被开掉。但是如果他们其中的一个拼死拼活的干活,而另一个偷懒,那么偷懒的雇员可以得到15个单位的效用,而卖力干活的得到的效用为0,但是不会被开除。于是两人都会希望对方认真做,而自己偷懒,但是,如果一方认为另一方不会认真做,为了避免被开除,他就只能卖力干活。记得上大学的时候做物理实验,两人一组,交1份实验报告。又一次我想偷懒了,就说不管怎样我都管实验报告了,和我一组的同学虽然郁闷,但也只能自己写了交上去。

古巴导弹危机就是斗鸡博弈的一个例子。如果美国和前苏联打起来,那估计就是核大战了,这对双方都是毁灭性的。因此谁要是能让对方相信自己会不惜一切代价强硬到底,对方就会退缩。终于到最后前苏联打了退堂鼓。

5.固定和博弈(fixed-sum game)

博弈还可以按照效用的总和来划分,如果把参与者所有的效用加起来,总和是固定的,那么就叫做固定和博弈,反之则成为变和博弈(variable-sum game)。很显然,在固定和博弈中,参与者不能进行合作。因为他们的利益是完全对立的,一方多得一点,另一方必然就会少一点。在变和博弈中,效用的总和可以变化,双方通过合作都能够获得比不合作带来更多的收益,从而有了合作的空间,但这也并不能消除双方之间的竞争。从长远来讲,博弈是变和的,但是在某一瞬时来讲,博弈又是固定和的,因而双方常常是合作中有竞争,竞争中又有合作。

篇七:博弈论读后感

在新浪公开课上学习的博弈论, 从第一颗就深深的被吸引,后在书店买书看后大大受益。在现代经济学发展中,数学与经济学结下了不解之缘。作为经济学的研究对象,人的行为变幻莫测,具有很大的不确定性;由于人的行为所产生的经济关系变化错综复杂,极大地增加了经济研究的难度。因此,经济学家不得不借助数学方法分析人的行为的本质特征,揭示经济系统运行的内在规律。数学方法在经济学研究中的应用渗透到几乎所有经济学分支学科领域,尤其是经济学的研究方法中,而博弈论是对现代经济学的发展产生意义深远影响的一种重要方法。而作为经管类专业的学生就很有必要阅读此书了。

通过本书,我了解到博弈论是一种以数学为基础,研究对抗冲突中最优解决问题的方法,并且逐渐跨越多个学科,广泛应用于经济学、政治学、哲学、商业以及国际关系的分析之中,成为理解人类行为的有力工具。

这本书给我印象深刻的博弈方法有双人博弈中的纳什均衡和三人博弈。我们会经常运用的纳什博弈。如果有两个战略(或者更一般的,有多个战略,每一个战略对应一个参与者),并且每个战略(或其他参与者的战略)的最优反应,我们就称这一战略组合为纳什均衡战略。它是求解博弈问题的一个普遍使用的方法,是一种非合作均衡。其实,每一个占优战略均衡也是纳什均衡,就像每只小獚犬同属于狗类一样。例如,在囚徒困境中“认罪”是每个囚徒的占优战略。而存在一个占优战略均衡。当一个囚徒选择“认罪”时,另一个囚徒的最优反应也是认罪。每个囚徒都选择了针对另一个囚徒所选择的最优反应。同时,对于经济学上的双寡头垄断的战略与定价,纳什均衡概念本身(即参与者将选择相对于其他人决策的最优反应战略)适用于所有以李瑞最大化为目标的理性企业的借个竞争。

而三人博弈只比两人博弈稍微复杂一点,同样可以用标准式进行表述,使用一张比两人博弈略微复杂的收益表格就足以说明问题。从另外的角度看,三人博弈比两人博弈要复杂得多。三人博弈包含了多人博弈的一些问题,类似问题在两人博弈中从未出现过,这种简单与复杂的结合使研究三人博弈变得可行,也更有价值。在三人博弈中,可以有两个人组成联盟,合作对抗第三人,这种情况是可能出现的,但在两人博弈中研究联盟就没有意义了。当然,在非合作博弈中并不是所有联盟都可行,只有符合纳什均衡的联盟才是稳定的,才能够存在。因此我们可以看到,在三人社会两难问题上,任何两人或多人联盟都会使参与者获得更多的收益迈不过没有一个联盟能像纳什均衡那样稳定。

更多地,此书还介绍了相关均衡、寡头垄断定价模型、博弈的合作解、序贯博弈、子博弈完美均衡以及重复博弈等等。这些对于我今后的学习和应用都具有很大的帮助。

最后我想说的是,学习和运用博弈论都是非常令人高兴的事情,希望大家有机会也来读读这本书并且从中体会到乐趣。

篇八:博弈论读后感

今天博弈论用期望的形式解释了为什么竞争对手是sb会令人很郁闷:

假设一个投资项目,在市场好的情况下一个人参与那么则可以赚100块,如果两个人同时参与,那么则没人赚40.如果市场不好的情况下一个人参与,那么可以赚5块,如果市场不好俩人参与,则俩人各赔20.

那么sb一直在观望我的行为,我认为市场不太好,那么我是该参与还是不该参与呢..

如果我假设我的竞争对手是一个智商极高的人,它也知道市场的情况,那么则罢了,如果是一个sb,他不太了解市场,看到我参与了他也来参与,换句话说,赔钱他也玩,所以需要率先决策的我就不敢玩了,这就使我失去了原本可以赚钱的机会。

正是因为老干这种损人不利己的事儿,所以那个人才被称作sb.

这种事儿在生活中多么常见啊!!

相关文章