本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 - P4 f- \. n2 F7 U3 A G0 Q
3 [8 }7 x* P1 n6 V% z/ i' _9 X& E3 s/ ^严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ x" J D- z- X 以下三个定义:
' |4 ~9 X; a0 @2 H# Y- [: m$ F 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; }8 D1 l2 h/ H. A$ P) R7 q) x% U 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . p* l/ S) Z( O& m: B+ U
所谓的双方优势策略则是指双方利益总和最大的策略。 3 T1 P5 R. r, c' D
[编辑本段]严格优势策略举例分析; g7 m, X* x% P7 r% B# m
一、经典的囚徒困境 - @3 J& h. s# A- g: d6 z' M
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- B( y# u0 o$ F$ ?( }) I; | 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & w- _. |) Y% M- h
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + i: |3 A- k; S m1 P
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# L/ G4 ^$ b5 N" [+ P2 x. h l2 Z4 Q 若二人都互相检举(互相“背叛”),则二人同样判监2年。
, ?0 _% k5 m8 R; H % Q* P7 }' `. V2 e/ b7 `4 w# S
用表格概述如下:1 ]% M# n3 B2 f+ W+ O) q
4 }- Y/ ]9 v9 X' `2 h- d 甲沉默(合作) 甲认罪(背叛)
) g' |& s( Y- a# ^乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 0 q- X- c( q( b% ^) R4 o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 # e! f& W' R$ j; z4 t
7 Q6 }- t# u1 A8 n }; { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - E% R+ }! W+ P1 K8 K" |
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + G y$ q5 Q! s" t/ @
若对方沉默、背叛会让我获释,所以会选择背叛。
) W Q& L7 b$ x2 T# \ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : P3 ]' `) v& r0 E2 v
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - A$ a. ]' T: m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) C1 w% [6 |& i" F$ f' |4 P
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! V/ h9 g: D! {8 X& a5 k
[编辑本段]二、智猪博弈理论/ {, V! p0 O$ j$ u8 }
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 R9 X4 a: q. l; r( N 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 h% Y' g, @7 A; b/ C
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# m9 T: I. ^; C( Q% v X3 b 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; `6 M' F$ ]( [* q5 a7 z9 L: Z/ w: i “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : {" h5 s& \: g3 C
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( C7 I5 e& L- p. j# y" { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! { @' x6 L' V0 ~' _5 t! o
, |1 j; X7 H, s. k
三、关于企业价格策略
+ B/ l* \: Q, f3 `1 q f/ Z0 x/ [) W5 \+ O) L5 i- z
+ z- j: w. h5 {. V' ? 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" M+ k1 x- \& U0 Z 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 _& q* T, w( L# Z; N1 f4 L4 W 以下三个定义:9 e( S7 ^7 t# o6 O' K) E: W1 Y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& T7 N& q! u4 o8 } 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . a% {3 z3 \, D. E5 c f
所谓的双方优势策略则是指双方利益总和最大的策略。
5 F3 s4 {. Q X[编辑本段]严格优势策略举例分析
* F2 J3 K' w' W/ T# W- [& s 一、经典的囚徒困境 ! t0 L" a" P; y) [5 X7 h x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 ?: ` m) G( j 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
# w8 W: Y2 e8 G2 v- Q7 o/ { 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; M5 o/ D L, [0 P2 h4 ~3 q$ m
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
0 o! W% Y7 F# i/ R: u0 X 若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ P8 c5 w8 X) x1 r
+ W3 k0 Z; r: c! M/ W3 [/ M0 e用表格概述如下:
0 |' {( x9 `4 E) I0 V7 ~' ]
; |3 r" g6 P1 l ^2 O3 {, x3 F! T z 甲沉默(合作) 甲认罪(背叛) 5 C! }/ W+ r6 ]' j1 l6 l; b1 @
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% B# U) m" I2 R! \; F乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# v" X5 I2 U9 \+ y! u$ x
( Z& D: \% W4 X- ^$ @8 C 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 V5 M! g: F8 _4 P" s- |
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: t4 _% S' Y; z3 G 若对方沉默、背叛会让我获释,所以会选择背叛。 % T; n; j E7 s: f4 M! O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 9 N0 l: n% e% \4 Q5 E4 R
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . n" ~* O/ E& F& ?$ L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& I' `! c1 @' P& [ ~; P2 H. x 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" B# V6 J) h/ [+ f" x[编辑本段]二、智猪博弈理论
, l, L# I0 d9 e. b# [- c 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# B5 }" c' u. J6 j- G+ D, n 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + u* i/ d; y7 {7 Y
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! |4 E# |$ q/ x* I 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; ^( H& \8 H5 E& N. p2 \6 w& T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. `! X1 ~% u* e: R* M1 m7 ` 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) J% D$ L) [' P0 \* l6 r
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: H2 |3 j# K" c( q
7 j5 [* | Z0 w* V% u3 F三、关于企业价格策略
' i8 T% W, l* r: ? N' v5 y: p0 @6 p9 h. I( W. D1 E
! f6 {$ W- f2 N4 ^* M* J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ |8 ]3 [8 T/ Q" \ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' l* Z1 {, J# F" U$ a 以下三个定义:; Y$ h9 D) y2 R
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + X$ i5 Z8 a8 G' K3 i* v6 y) k& Q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ c$ K* `2 V- O5 i# x% Z 所谓的双方优势策略则是指双方利益总和最大的策略。
8 q+ F: j/ I6 Z5 Q8 O1 l[编辑本段]严格优势策略举例分析" ^6 @. v( F9 n" H+ ^- F
一、经典的囚徒困境 * ^/ k! n9 R/ `4 o# J1 S( g
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 h( F, Z! l1 F! E 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 {1 Q: h' G8 o, | 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( B/ r @" a5 O/ B+ m( q
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 n' V% F/ |" h 若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 D- O! u: h$ ^! K i. s
8 ~9 i8 y' ~( t& @2 S用表格概述如下:; K6 `" H+ ^. ?
0 t9 [: K$ N2 y* F3 b+ `4 a
甲沉默(合作) 甲认罪(背叛) & n, I% ?4 ]. b- T: p
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 x$ |5 {3 E2 l0 C乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
) w5 m( j$ d" e9 J
, B0 V& y3 {3 \ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! O; f( W, [2 p9 _7 ~+ O0 R
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 \- ~" a0 t& w. `% \) R 若对方沉默、背叛会让我获释,所以会选择背叛。 3 n' O5 d8 `- U0 H2 S9 @% J
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! q2 ^6 \; h/ d7 A. [! ? 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; Q2 H. k' H; ]) c' T
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 b$ M2 O5 A1 n0 f1 V& p3 W0 J$ r: P 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 T* W+ k0 o, @[编辑本段]二、智猪博弈理论; Z P7 D3 B" i4 v$ i; `/ N! I
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ ?0 t$ ~2 j' a, V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . G1 n, x0 k9 O: y7 p
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 / G3 c) o0 k+ V! n4 f3 t0 I
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! h, L& d% V: u* D& y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : t5 l8 S3 i: a9 X) H* ~
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) }- A( q9 N% J# q) p 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: F+ a4 ?* \% k0 x6 K d + x6 e# l5 T# g. _& h& Q8 l6 a
三、关于企业价格策略
2 p: i v% n0 o6 w4 s3 p3 {+ t3 H. @+ J4 D
) _1 b! H/ d9 u- r' C6 c
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % o4 @; O5 i' {" v
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
t' r( i1 d: |+ H( J$ p5 G 以下三个定义:
3 A4 Y" Q0 p/ y$ ?) g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! l8 p) N7 g4 ` 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: j3 L) Q; R* X 所谓的双方优势策略则是指双方利益总和最大的策略。 - \: v* H7 V, f- K% b
[编辑本段]严格优势策略举例分析1 d6 h U7 t x6 a4 D) ~
一、经典的囚徒困境 5 m( ^# J$ j3 k) d4 @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- \* Q8 a% k) L: ?/ j" R 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! Q7 E' U* U# \2 Z) }* z
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ V3 p1 W) T; ^9 { 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) R1 s+ S* G0 H% I- q- l 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 ~. |. t& g7 s: R# {9 D0 v
. y% ~$ K. {8 K/ q/ L用表格概述如下:$ f7 z# d9 [' M$ q. P
0 h% b% c. G9 n1 q5 g* W0 G
甲沉默(合作) 甲认罪(背叛) - O! r9 z8 s- Q' t! u: I n. l
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - Q% a/ R1 ~% i$ Q% P F
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( F4 s, Z# j4 p3 x8 R8 W
/ N" Q6 L# @ O W4 k0 }2 ~ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! E' |0 J- ]' j" s3 V1 J* Z$ h9 A
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . r+ R& r% D1 F
若对方沉默、背叛会让我获释,所以会选择背叛。 7 F h2 m- g; Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 R4 q6 Y7 R2 {5 @$ ]% r
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 a# j7 j& V% }" L% w
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
J- N7 n5 m& ^7 Z7 O4 E$ U 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 k) B4 a8 q0 ]1 {% v. r
[编辑本段]二、智猪博弈理论
5 Z7 T5 R: Z8 d+ ? B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ ?0 z9 |2 |! E2 a 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 l: Q7 P3 B7 T5 J) z! X, N! V2 @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % Q# g. D. e" f9 ]3 `2 N+ {! Q, X
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 _) g* D- z/ u: C# c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! Z( E9 }; w( w2 z& i* L
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + |0 \( L! x' ^4 ~ M1 z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 ~0 a: p" ?# G5 |( Q
- N5 R$ Q3 S* F) f1 f% N1 b1 `三、关于企业价格策略
+ e3 Q: v4 \9 b U1 l" B8 b
n; q$ A- d+ M , ]. P/ ?7 D* M" |: d! _) i
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; K# h* J! m. c+ N7 i6 M5 d0 K 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |