欢迎来到易发表网!

关于我们 期刊咨询 科普杂志

博弈最优策略优选九篇

时间:2023-08-25 16:39:18

引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇博弈最优策略范例。如需获取更多原创内容,可随时联系我们的客服老师。

博弈最优策略

第1篇

论文摘要:信贷市场中,企业获得贷款后基于自身利益的驱动会产生道德风险,从而加大了银行信贷风险。本文建立了银企博弈模型,得出银行可以将审核概率控制在一定阀值上,从而降低企业的道德风险。在此基础上,设计了银行对借款企业的激励契约,得出抵押物价值和贷款利率的最优线性关系。

随着我国金融业的不断开放,我国商业银行面临着日益激烈的竞争,借款企业的道德风险已经成为银行较高不良资产率的主要原因之一发放贷款后,由于信息不对称,银行往往无法对企业进行有效监控,企业可能做出损害银行利益的行为,这就是企业道德风险。

银企博弈模型

交易双方为银行和借款企业,假设两者均风险中立。博弈顺序如下:借贷双方针对某一项目签订借贷合同,贷款额度为B。合同规定抵押价值Q以及贷款利率i等,显然Q>B。企业可选择“不改变资金用途”或“改变资金用途”两种纯策略,对应的项目失败概率t1和t2,显然,t10,高风险意味着高收益)。银行收益始终为r,有r=iB。项目失败后,银行由于存在审核成本,故其策略有“审核”与“不审核”,对应概率分别为α和1-α,审核成本为C。如果审查出企业“改变资金用途”,则银行没收抵押后并给予企业惩罚π,其中可以是信用等级的降低等。

双方收益函数:企业不改变资金用途,如果项目成功,企业和银行收益分别为R-r 和r;如果项目失败并且银行选择审核,双方收益分别为B-Q和Q-B-C,如果银行选择不审,双方收益分别为B-Q和Q-B。企业改变资金用途,如果项目成功,企业和银行收益分别为R+Δ-r和r;如果项目失败并且银行选择审核,双方收益分别为B-Q-π和π+Q-B-C,如果银行选择不审,双方收益分别为B-Q和Q-B。

博弈的均衡分析

如果一个混合策略是企业的最优选择,那么意味着企业是否改变资金用途的期望收益无差异,即:(1-t1)(R-r)+t1[α(B-Q)+(1-α)(B-Q)]=(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)],得出:

同理,如果一个混合策略是银行的最优选择,那么意味着银行审核与不审核之间的期望收益是无差异的。引入一个条件概率λ(c/f),表示项目失败后银行认为企业改变资金用途的概率,由贝叶斯法则得: 这种情况下银行审核与不审核的期望收益相同,即:λ(c/f)(π+Q-B-C)+[1-λ(c/f )](Q-B-C)=Q-B,得出:

因此,所求的α和p即为所求纳什均衡点。这表明当银行审核概率低于α时,企业最优策略是改变资金用途;当银行认为企业改变资金用途的概率小于p时,考虑到审核成本,银行选择不去审核。所以,银行可以将审核概率控制在一定阀值之上,就能够有效控制道德风险。

激励契约设计

银行在设计契约时,应理性预期到双方的博弈策略选择及其各种局势的支付,进而设计激励契约。设计契约如下:

{(1-p)(1-t1)r+(1-p)t1[α(B-Q-C)+(1-α)(Q-B )]+p (1-t2)r+pt2[α(π+Q-B )+(1-α)(Q-B )]} (1)

s.t(1-t1)(R-r)+t1(B-Q)≥0(2)

(1-t1)(R-r)+t1(B-Q)≥(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)] (3)

r=iB (4)

银行的最优策略是使自身期望收益即(公式1)达到最大;同时应满足不改变资金用途的企业的参与约束(公式2);为激励企业不改变资金用途,还应满足激励约束(公式3),即不改变资金用途的企业获得的收益应大于改变资金用途的企业。(公式4)为r与B的关系。

添加参与约束因子β和激励约束因子γ构造拉格朗日函数,得出β=1,γ=1-p。

当γ≠0,即p≠1时,因此约束条件(2)和(3)取等号,解之得:;当γ=0,即p =1时,即银行认为企业一定会改变资金用途,则银行一定会审核,即α=1。

由结果可知,在最优博弈策略的基础上,银行利润最大时其最优抵押物价值和贷款利率存在以上线性关系。一般,当贷款额度和贷款利率一定时,抵押物价值与项目失败率成反比,因此,银行可以通过设计不同的抵押物价值要求的契约来对企业进行激励。

参考文献

第2篇

关键词 均值方差准则; 随机微分博弈; 线性二次控制; 负债

中图分类号 F830 , O225 文献标识码 A

1 引 言

均值方差投资组合选择的目标是,在终值财富的均值给定时使其方差最小.文献[1]第一次用计量数学方法研究了该问题,并给出了求解投资组合策略的理论框架.近年来,由于人们对经济问题的持续关注,均值方差投资组合选择问题已成为数理金融研究的最热点问题.文献[2]研究了动态多个时代的均值方差组合问题.文献[3]在随机LQ的框架下研究了连续时间均值方差组合问题,通过随机LQ得到了最优策略和有效边界.文献[4]研究了马尔柯夫调制市场上具有资产负债的均值方差组合问题,获得了最优策略和有效边界.

在研究中,发现已有文献对均值方差问题的研究,大多只从投资者的角度出发,获得最优投资组合,而没有考虑市场不确定性对投资者的影响.在实际中,投资者肯定会受到市场不确定性因素的影响,因此从投资者和市场2个角度同时考虑才更符合实际.这就是随机微分博弈问题.随机微分博弈属于博弈论的范畴.博弈论虽然古已有之,但文献[5]的发表才标志着随机微分博弈时代的真正到来.随机微分博弈,假设市场是博弈的“虚拟”对手,通过投资者和市场之间的双重博弈得到最优的投资组合.它如今已成为数理金融学、管理学科的研究热点.文献[6]在跳-扩散金融市场中,利用随机微分博弈论研究了风险最小化的投资组合策略问题.文献[7]利用随机微分博弈论研究了Markov调制模型下的期权估值问题.文献[8]研究了两个具有相关但不同投资机会的投资者之间基于随机微分博弈的最优投资问题.文献[9]在幂效用和指数效用下研究了具有负债的随机微分博弈.文献[10]在幂效用和指数效用下研究了基于再保险和投资的随机微分博弈.

已往文献对随机微分博弈的研究大多数都是基于效用的,很少研究基于均值方差准则的随机微分博弈.基于已往文献对均值方差问题和随机微分博弈的研究,本文尝试把这2个问题结合起来研究.另外,目前资产负债管理已经受到理论界和许多金融机构的重视,有越来越多的学者对其进行研究,这里不再一一列举.因此本文在文献[9]基础上研究了基于均值方差随机微分博弈的资产负债管理.目标是当终值财富的均值一定时,在市场最坏的情况下,投资者选择一个最优的投资策略最小化终值财富的方差.应用线性二次控制理论求得了最优投资策略、最优市场策略和有效边界,并分析了负债对它们的影响.本文的创新点是:在资产负债管理中引入了均值方差随机微分博弈.通过本文的研究在实践上可以指导投资者在具有负债和市场出现最坏情况下,选择恰当的投资策略使自身获得一定的财富而面临的风险最小;同时在理论上丰富和发展了资产负债管理和随机微分博弈.

2 模型设定

2.1 金融市场

参考文献

[1] H M MARKOWITZ. Portfolio section [J]. Journal of Finance, 1952, 7(1):77-91.

[2] D LI, W L NG. Optimal dynamic portfolio selection: multiperiod meanvariance formulation [J]. Mathematical Finance , 2000, 10(3):387-406.

[3] X ZHOU, G YIN. Markowitz’s meanvariance portfolio selection with regime switching:a continuoustime model [J]. SIAM Journal on control and optimal, 2003, 42(4):1466-1482.

[4] S X XIE. Continuoustime portfolio selection with liability and regime switching [J]. Insurance: Mathematical and Economics, 2009, 45(1):148-155.

[5] R ISAACS. Differential Games [M]. New York:Wiley,1965.

[6] S MATARAMVURA, B OKSENDAL. Risk minimizing portfolios and HJBI equations for stochastic differential games [J]. Stochastics An International Journal of Probability and Stochastic Processes, 2008, 4(3): 317-337.

[7] T K SIU. A game theoretic approach to option valuation under Markovian regimeswitching models [J]. Insurance: Mathematics and Economics, 2008, 42(3):1146-1158.

[8] S BROWNE. Stochastic differential portfolio games [J]. Journal of Applied Probability, 2000, 37 (1):126-147.

[9] 杨鹏,林祥.随机微分博弈下的资产负债管理[J].中山大学学报:自然科学版,2013,52(6): 30-33.

第3篇

自20世纪90年代以来,科学技术和经济快速发展,市场开始全球化,企业面临的竞争日趋激烈。技术的进步和需求的多样化,使产品寿命周期不断缩短,因而企业面临着缩短交货期、提高产品质量、降低成本和改进服务的压力。如何以更高的产品价值、更优的产品质量、更低廉的成本、更快捷的市场反应速度和更满意的服务与竞争者抗衡;如何占领尽可能大的市场份额,成为企业经营战略的核心,也成为企业面临的重要问题。供应链的产生改变了现代企业的竞争方式,使得企业间通过加强合作来提高竞争力,共同将利益蛋糕做大,建立一种“共赢”的战略合作伙伴关系。在建立合作伙伴关系中,由于利益的原因,双方之间往往存在着策略的对抗和竞争,或对某一种局面的对策选择,因此须对建立供应链合作伙伴关系采用非合作博弈的方法去分析。

现在非合作博弈在经济管理中已得到了广泛的应用,Nash均衡作为非合作博弈的一个重要概念,是所有应用领域中希望得到的最优状态。虽然理论上已经证明了它的存在性,但是并没有给出求解Nash均衡的一般性算法。尤其是对规模较大的问题,现有的方法很难给出解。随着现代优化算法的发展,人们开始把遗传算法引入到均衡求解中来。2001年,陈士俊等[1]提出了一种求解Nash均衡解的遗传算法。仝凌云等[2]运用双种群自适应遗传算法解决了虚拟企业伙伴选择的问题。王成山等[3]以改进的遗传算法为基础,提出了一种适用于输电网投资博弈的均衡分析方法。以上这些算法都是对经典的Nash均衡设计的。2004年,曾玲等[4]针对产品价格为模糊变量的一般递阶资源分配问题,设计了一个求解Stackelberg-Nash均衡解的基于模糊模拟的二层遗传算法。本文将在此基础上为模糊非合作博弈设计一个求解模糊均衡的基于模糊优先关系的遗传算法,并通过一个实例进行验证。

一、模糊非合作博弈

定义1局中人的集合为,局中人的策略集为,当每个局中人选定一个策略()后,就形成了博弈的一个局势;对于每一个局势 ,局中人 有一个模糊支付函数,则为一个模糊非合作博弈。

定义2设是模糊非合作博弈的一个局势,如果

则称为的一个均衡局势。

定义3对于模糊非合作博弈,为局中人的模糊占优策略的隶属度为

.

定义4对于模糊非合作博弈,局势S为的模糊均衡的隶属度为

.

定义5对于模糊非合作博弈,如果对隶属函数有

则称局势为的最优模糊均衡。

二、求解模糊均衡的遗传算法

对于模糊非合作博弈,其最优模糊均衡满足。显然这是一个组合最优化问题,随着局中人数量以及策略集元素的增加,求解最优模糊均衡的计算量是指数增长的。这是一个NP-hard问题。

我们将每个局势看作自然界中的一个生物体,每个局中人的策略看作是生物体的不同染色体。正如生物体的生存性质与染色体组的基因关系,最优解也将是算法过程中的最优模糊均衡,从而获得有限n人非合作模糊博弈的最优模糊均衡。在此我们假设所有局中人均有m个策略。

首先我们对问题进行编码。根据非合作模糊博弈的特点,本文采用常规码,对于局中人,其策略集为,向量是局中人的决策向量,其中表示局中人没有选取第个策略,表示局中人选择了第个策略。所有局中人的选择构成了博弈的一个局势,则局势可以用向量表示。

随机选择个局势作为初始群体,

由定义4,可知衡量最优模糊均衡的指标函数为:

又由定义2,3,局势为模糊均衡的隶属度是:

现在问题转化为求的最大值。作适应函数:

计算概率

并以此概率分布从中随机选一些染色体构成一个种群(集中可能重复选中的一个元素)。

因为前面采用了常规编码,而局势的变化随每一个局中人策略选择的变化而变化,所以选择规则时,我们采用单亲遗传法。

从1到中随机选取个数,对于每一个,将第个分量与第个分量交换当时,;得到新的,组成新的局势。将中所有染色体进行上述,得到。

以某个较小的概率p发生变异,得到,令,,形成新的群体,循环计算。

当或者迭代次数达到某个次数时,终止程序。

简单遗传算法有可能不收敛到全局最优解,因此需要简单遗传算法作一点改动,每次记下当前最优解并在群体状态最前增加一维存放当前最优解,则遗传算法收敛到最优解。

改进后的遗传算法其主要特征是:进化的每一代,记录前面各代遗传的最优解并存放在群体的第一位,这个染色体只起到一个记录的功能不参加遗传运算。

现将模糊均衡的改进遗传算法叙述如下:

步骤一:给定群体规模,初始群体;

步骤二:对群体中的每一个染色体计算它的适应函数

,;

步骤三:若停止规则满足,则算法停止;否则,计算概率

以此概率分布从中随机选一些染色体构成一个种群;

步骤四:通过单亲遗传法进行,概率为,得到;

步骤五:以一个较小的概率p,使得一个染色体的一个基因发生变异,形成;在中记录当前最优解,,形成一个新的群体;

返回步骤二。

三、实际应用

下面通过一个具体的实例来验证一下算法的有效性。

假设现有同行业的两个制造商甲和乙,他们希望建立供应链的方式来提高自身的竞争力,在建立合作伙伴关系的过程中,各自有3个可供选择的供应商,他们的选择结果是互相影响的,根据不同的情况,甲和乙的收益矩阵如下:

遗传算法的参数选择:群体规模=3;概率为0.5;变异概率为0.2;算法终止条件为:迭代次数达到100或者当均衡隶属度高于0.5算法停止。通过计算,我们得到上述问题的最优均衡局势为甲选择策略3,乙选择策略3,即局势(3,3)为模糊均衡的隶属度为0.214。

四、小结

本文先给出了具有模糊支付的非合作博弈的定义,以及求解模糊均衡的定义,但是发现当局中人数量较多,或策略较多时,依靠枚举法进行求解是非常繁琐的,这是一个NP-hard问题。为了求得最优模糊均衡,在一个求解Stackelberg-Nash均衡解的基于模糊模拟的二层遗传算法的基础上,为模糊非合作博弈设计了一个求解模糊均衡的基于模糊优先关系的遗传算法,并给出了求解最优模糊均衡的改进遗传算法,最后通过一个实例进行了验证。

[1]陈士俊,孙永广,吴宗鑫.一种求解Nash均衡解的遗传算法[J].系统工程,2001.19

[2]仝凌云,陈增强,袁著祉,安利平.虚拟企业伙伴选择的双种群自适应遗传算法[J].计算机工程,2006.32

第4篇

关键词:博弈论;围标串标;治理

中图分类号:F22 文献标志码:A 文章编号:1673—291X(2012)28—0210—03

一、博弈论概述

博弈论是专门研究博弈如何出现均衡的规律的学科[1]。博弈论的思想最早出现于18世纪,20世纪20年代,由科学家冯·诺依曼和经济学家奥斯卡·摩根斯坦恩合著的《博弈与经济行为的理论》一书中将博弈论真正作为了一种理论研究。他们提出了策略型和广义型等基本博弈模型、解的概念和分析方法,构建了博弈论的理论框架。1951年纳什对静态博弈模型提出了纳什均衡的概念,明示了博弈论与经济均衡的内在联系。

博弈论又称对策论,是研究决策主体在决策主体各方相互作用情况下如何进行决策及有关决策均衡问题的理论。博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。博弈论的精髓在于博弈中的理性决策者必须考虑在其他局中人反应的前提下来选择自己最理想的行动方案。所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结果,它可能不是局中各方及整体的利益最大化,但它是在已给信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。

博弈论假设人是理性的,即人人都会在给定的条件下想办法使自身利益最大化。另外,人们在合作交往中有冲突,行为决策会受到相互的影响,且信息通常不对称。在现实中,博弈的最终结果往往是博弈的各参与人的策略组合达到一个均衡的结果,我们称之为纳什均衡。一旦达到这种均衡,博弈的任何一方都不会有积极性偏离这种均衡。

在一个存在n个参与者的博弈中,假设所有参与者都是理性的,如果策略组合s*是一个均衡的话,那么给定n—1个参与者的策略,某个特定参与者所选择的策略一定是最优的

(否则与理性人的假设相矛盾);因为某特定参与者是任意选取的,因而上述特性对每个参与者都成立。换言之,对于一个策略组合s*,如果保持其他参与者的策略不变,而任意一个参与者的策略都是最优的,那么策略组合s*就是纳什均衡。归纳为一句话即为:“最优对任一参与者的任一策略成立。”简而言之,纳什均衡就是在给定其他参与人策略的条件下,每个人选择自己的最优策略。

用数学公式可这样表示:如果一个策略组合s*=(s*1,…,s*n)是博弈G={S,U}的一个纳什均衡,那么对任一参与者i=1,2,…,n,对其任意一个策略si∈Si,不等式ui(s*i,s—i)≥ui(si,s—i)成立。

纳什均衡的运用非常广泛,最为有名的一个例子就是由塔克给出的“囚徒困境”博弈模型。囚徒1和囚徒2共同作案,被抓住,警方将两名囚徒分开在两间审讯室同时审问,他们都只有两个选择,招供和沉默。警方提出这样的条件:若两人都招供,则证据确凿,两人均被判六年;若一人招供,一人沉默,则招供的囚徒可立即释放,而沉默的人则加刑二年;若两名囚徒均不招供,则因证据不足只能判他们一年。由此分析如下:

1.参与者集合:N={1,2}。

2.策略空间:囚徒1的策略空间S1={沉默,招供},囚徒 2的策略空间S2={沉默,招供}。

3.偏好和收益函数:囚徒1的偏好为,(招供,沉默),(沉默,沉默),(招供,招供),(沉默,招供)。前一项为囚徒1的策略,后一项为囚徒2的策略。囚徒2的偏好类似。定义u1(s1j,s2k)和u2(s1j,s2k)分别为囚徒1和囚徒2的收益函数。所有收益如下:

u1(s11,s21)=—1 u1(s11,s22)=—8

u1(s12,s21)=0 u1(s12,s22)=—6

u2(s11,s21)=—1 u2(s11,s22)=0

u2(s12,s21)=—8 u2(s12,s22)=—6

显然有:

u1(s12,s21)=0>u1(s11,s21)=—1>u1(s12,s22)=—6>u1(s11,s22)=—8

u2(s11,s22)=0>u2(s11,s21)=—1>u2(s12,s22)=—6>u2(s12,s21)=—8

囚徒困境博弈模型(见下页图1)。

图1 囚徒博弈矩阵

由图1可清楚的看出,在完全不清楚对方如何决策的条件下,对于囚徒1,不论囚徒2选定的是招供还是沉默,他都应该选择招供,因为招供是他的严格占优策略;同样的,对于囚徒2,不论囚徒1如何选择,招供是他的严格占优策略。于是(招供,招供)是该博弈模型的严格优策略。同时,(招供,招供)是该模型的一个纳什均衡。如果给定囚徒2选择招供,则囚徒1的最优策略只可为招供;反之,给定囚徒1选择招供,囚徒2的最优策略也只能是招供。

二、围标串标的危害

所谓“围标”,是指某个投标人通过一定的途径,秘密伙同其他投标人共同商量投标策略,串通投标报价,排斥其他投标人的公平竞争,以非法手段赢取中标的一种违法行为。围标行为的发起者称为围标人,参与围标行为的投标人称为陪标人。所谓“串标”,是指在工程招投标过程中,几家投标单位通过事先商定,联合对招标项目的一个或几个招标标段用一致性报价、压价或抬价等手段串通报价,以达到排斥其他投标人,控制中标价格和中标结果,让他们其中的投标者中标的目的。

第5篇

关键词:大学生就业UIG合作体系;博弈;共赢

一、前言

大学生就业一直是高等教育界乃至整个社会共同关注的话题。近几年我国经济进入新常态,在经济下行压力和产业结构调整的大背景下,就业压力问题更加突出,结构性矛盾更加凸显。与此同时,高校毕业生人数逐年增加,2017年高校毕业生将达795万,较去年增加30万人数,这在一定程度上导致我国当前就业形势更加严峻和复杂。基于此,本文借鉴“产学研合作”研究的方法,提出大学生就业UIG合作机制,并进一步探讨了UIG合作机制中相关利益主体的博弈分析,试图缓解当前就业难问题。

二、大学生就业UIG合作创新体系中的利益主体

政府在大学生就业UIG合作过程中发挥宏观指导作用,政府主要通过制定相关方针政策起作用,它是引导大学生就业的重要力量。就业政策就像是“看得见的手”,不仅可以弥补劳动力市场这只“看不见的手”的不足,而且能够引导和促进“看不见的手”,在大学生就业过程中更好发挥作用。政府具有资金和政策的优势,政府应制定相应的政策法规,地方各级政府也必须高度重视,发挥政府的组织优势、资源调控优势、公共管理优势,形成政府、高校和企业的协同运作,在税收、信贷、经费等方面积极发挥调节作用。企业在大学生就业UIG合作具有实践作用。企业作为人才的需求方,应利用自身对市场的联系,及时反馈市场对人才的需求。这样,高校才能快速调整培养模式,向企业输送急需人才。此外,企业应为毕业生提供实习平台,参与人才培养的过程来,这样培养的人才,有助于企业未来的发展。高校就业率是评价一个学校的标准,社会对就业率的强势关注在一定程度上促进了高校对大学毕业生就业工作的重视。高校作为劳动力市场的供给方,每年向企业和政府部门培养和输送大批优秀人才,应该打破传统人才培养模式,在产学研合作的基础上,促进校企合作培养人才,实现企业需求与人才培养之间“零距离”,社会需求和岗位要求“零距离”,实施教育与上岗就业之间“无缝连接”,结合市场需求、企业要求和大学生自身需求,积极推进人才教育模式的革新,进行顶层设计。高校学科专业结构需要同社会、经济发展规律相适应,根据不同的办学层次、类型和定位,形成特色专业,使培养的学生能够符合现有市场的要求。政府也应该在高校教育体制改革上给予一定的支持,确保新的培养模式的能够进行。其次,针对大学毕业生,高校就业指导需要有效“补位”。高校应促进校企合作,让企业加入高校人才培养中来,利用企业的资源和平台,从而实现毕业生有效、快速的就业。

三、大学生就业UIG合作创新体系的博弈分析

政府、企业、高校三者之间的利益既存在一定矛盾,也有协调的一面。由于涉及政府、企业、高校三者之间的利益博弈,为简单起见,本文在“经纪人”和不完全信息假设条件下,采用博弈(EvolutionaryGame)方法,分别讨论政府与企业、企业与高校、高校与政府之间的利益博弈,以此来解释大学生就业UIG合作创新体系的可行性。

(一)政府与高校的利益博弈分析

政府与高校博弈的收益矩阵如表1所示。通过对政府与高校博弈的收益矩阵的分析可知,对高校而言,无论政府选择“支持”或者“不支持”策略,“作为”是高校的最优选择(理由:1>-1;6>3)。同理,对政府而言,无论学校选择“作为”或者“不作为”策略,政府都会选择“支持”策略。因此,策略组合(作为,支持)是该博弈的纳什均衡,此时,双方也达到帕累托最优状态,即最优均衡策略,其均衡报酬为(6,4)。政府和高校的博弈过程和结果表明,在大学生就业UIG合作方面,政府与高校的利益目标基本一致,政府关注大学生就业问题,有利于社会的稳定和发展,而高校重视毕业生就业率对自身以后的招生和长期发展十分有利。因此,政府和高校会达成共识,共同努力,来解决大学生“就业难”问题,从而实现双赢的效果。

(二)高校与企业的利益博弈分析

高校与企业博弈的收益矩阵如表2所示.通过对高校与企业博弈的收益矩阵分析可知,对企业而言,无论高校选择“作为”或者“不作为”策略,“配合”是企业的最优选择(理由:3>1;5>2)。同理,对高校而言,无论企业选择“配合”或者“不配合”策略,高校都会选择“作为”策略。因此,策略组合(配合,作为)是该博弈的纳什均衡,此时,双方也达到帕累托最优状态,即最优均衡策略,其均衡报酬为(5,4)。企业和政府的博弈过程和结果表明,在大学生就业UIG合作方面,企业与高校的利益目标基本一致,企业需要符合自己发展的人才,而积极与高校交流,有利于企业科研成果转化为产品,是企业在市场立于不败之地。高校重视毕业生就业率对自身以后的招生和长期发展十分有利,而与企业合作,可以共享其资源和平台,将有利于高校科研的发展。因此,政府和高校会达成共识,共同努力,来解决大学生“就业难”问题,从而实现双赢的效果。

(三)企业与政府的利益博弈分析

企业与政府博弈收益矩阵如表3所示。通过对企业与政府博弈的收益矩阵分析可追,对政府而言,无论企业选择“配合”或者“不配合”策略,“支持”是政府最优的选择(理由:1>-2;6>1)。同理,对企业而言,无论政府选择“支持”或者“不支持”策略,企业都会选择“配合”策略。因此,策略组合(支持,配合)是该博弈的纳什均衡,此时,双方也达到帕累托最优状态,即最优均衡策略,其均衡报酬为(6,5)。企业与政府博弈的过程与结果表明,在大学生就业UIG合作方面,企业与政府的利益目标基本一致,企业一方面能够招聘到符合自己发展的人才,另一方面参与大学生就业UIG合作,在一定程度上可以获得政策支持,这有利于企业的长期发展,而政府通过在大学生就业UIG合作发挥积极作用,可以降低社会失业率,有利社会的稳定和发展。因此,企业和政府会达成共识,共同努力,来解决大学生“就业难”问题,从而实现双赢的效果。

四、研究结论

在大学生就业UIG合作过程中,政府、企业和高校三者既有协调的方面,也存在一些矛盾,总体上,三者之间利益目标基本一致。本文基于博弈论的视角,利用数值模拟讨论了三者在大学生就业UIG合作过程的利益博弈,得到其最优策略,从博弈结果可知,大学生就业UIG合作在理论上具有很强的可行性,是一种多方“共赢”的模式。

参考文献:

[1]杨伟国.《借重“看得见的手”——谈谈国外对大学生就业的政策支持》,《求是》,2004年第6期。

第6篇

纳什博弈论:指假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益,即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的,则此策略组合被称为纳什均衡;所有局中人策略构成一个策略组合,纳什博弈论,从实质上是一种非合作博弈状态;

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的;纳什均衡也不意味着博弈双方达到了一个整体的最优状态,最优策略不一定达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。

(来源:文章屋网 )

第7篇

关键词:水资源;政府管制;产权;博弈

[中图分类号]F272.92;F224.32 [文献标识码]A [文章编号]1009-9646(2012)4-0078-02

一、水资源环境污染的博弈分析

水资源环境污染问题,即水质博弈,厂商之间的“囚徒困境”问题。首先假定市场自由竞争,政府不进行管制,在环境污染博弈中参与人是两个相同的排污者A与B,两方的策略是排污与不排污,假设两个人都不排污,有一个好的环境,大家收益都为20;如果大家都排污,这时环境恶化,每个人的收益都降低到9;如果一人不排污,另一人排污,由于治理污染要付出成本,不排污者的收益为为4,而排污者的收益为15。该博弈的支付矩阵见图1:

图1 无管制情况下排污者之间博弈

该博弈有两个纳什均衡,即(9,9)和(20,20)也就是两方同时排污或者同时不排污。但是纳什均衡(20,20)是不稳定的,因为A与B两方合谋不排污是不可信的,一旦一个选择不排污,另一个可能排污,那么排污者的收益为15,不排污者的收益为4。最后的纳什均衡是(9,9),社会的总效益为18,而不是40,此实际是两人博弈的囚徒困境。在现实经济中排污者有很多个,假定有n个排污者,这实际上就是有n个局中人的博弈模型。在没有政府监管的情况下,这n个局中人进行博弈,他们会根据利益最大化选择自己的策略,要么排污要么不排污,如果大家都不排污,环境不会被污染,整个社会福利最大。但是合谋不排污是不可信的,因为如果你不排污就要进行污染治理,治理要成本,结果你和别人共享同样的环境,你的效用相对他人较低,因此你不排污你吃亏,结果大家都排污,这就是n人博弈的囚徒困境。

二、政府与用水单位之间的博弈

政府代表供水单位,此为水量博弈。我国长期以来对耗水大的单位,供水无限量且价格低廉,导致大家缺乏节水动力。为了达到水资源的最优配置,对供水与用水单位之间进行博弈分析。该博弈的三要素是:博弈参与人集合:{政府,用水单位};政府的策略集是:供水多,供水少,用水单位的策略集是:节约水,不节水;设参与人的收益如图2所示:

图2 供水与节水之间博弈

当政府的策略是供水多时,用水单位采取的最优策略是不节水,由图2可知由于15>12;当给定用水单位不节水时,政府的最优策略是供水少,收益为6;当给定政府供水少时,用水单位的最优策略是节水,收益选择为10;当给定用水单位节水时,政府的最优策略是供水多因为15>3,此博弈不存在纳什均衡。在这种情况下,政府如采用水权交易能收效甚大,与用水单位交易,用量多的需花大成本购买大的用水权,这就促使用水多的单位节约用水以节约成本。为此生产用水价位要高,而生活用水要低;将用水量分若干档次水价,按不同档次由低到高递增计价;夏天与冬天应按不同水价计费,目的也是促进节约用水;洗用水做到达标排放,这样可循环用水,也可避免污染水环境,其治理费用要计入水厂成本中,通过上述措施达到水资源的最优配置。

三、政府与厂商之间博弈分析

1.府与厂商之间的不完全信息动态博弈

厂商一般比较清楚政府各次制定的环保法规等,但政府很难了解厂商的执行情况,即信息不对称。此外,短期内环境改善或污染的损益不易表现并很难计量。因此,厂商与政府就形成了一个不完全信息动态博弈。将有关厂商看作厂商A,而政府为B,就构成了两个博弈方的动态博弈。图3表示政府与厂商之间的子博弈,p1、p2、p1 、p2′、q1、q2指博弈方选择对应策略的概率,对方很难准确把握,(u、v)指A、B博弈方得益。在此博弈中,如果p1=1,p2=0,那么博弈提前结束,等到人们对环境质量有更高要求时,政府又开始制定新环保法规,博弈又开始,环境质量将得到不断改善。但政府管制对于厂商来说是一种威胁,如果q1>q2,则它是可信的威胁,那么厂商在上阶段很可能选择不违规,即p1>p2;反之q2>q1,博弈继续向下进行,环

境向着恶性发展。目前我国的环保法规不够严厉,即使上交罚金,仍有高额暴利,因此政府的法规只是一种不可信“威胁”。

图3 政府与厂商之间的动态子博弈

2.政府与厂商之间的静态博弈

此博弈中,政府的选择是打击与不打击,厂商的选择为合理与不合理排污。这是一个静态博弈,其支付矩阵如图4:其中a,b分别为厂商合理排污的概率、政府打击厂商违法排污行为的概率,A为厂商合理排污的成本,C为政府打击违法排污行为的成本,F是厂商不合理排污时被政府发现后的罚款。给定a,政府选择打击与不打击的期望收益分别为(G为政府,Q为厂商):

图4 政府与厂商之间的静态博弈

G(1,a)=C*a+(F-C)*(1a); G(0,a)=0,解 G(1,a)= G(0,a)= 0,得a*=(FC)/F。即:若厂商合理排污的概率大于(FC)/F,政府最优选择是不打击;否则反之。给定b,厂商选择合理与不合理排污的期望收益分别为: Q(b,1)=A*b+(-A)*(1b); Q(b,0)=(FA)*b,解 Q(b,1)= Q(b,0)=0,得b*=A/(A+F)。若政府打击违法排污行为的概率小于A/(A+F),厂商最优选择是不合理排污;否则反之。因此政府应严厉打击违法排污行为,使政府的打击行为成为对厂商不可置疑的威胁,这样厂商才会合理排污,而且水质和水量之间也是相互影响的,污水资源化,既可减少环境污染,又能提高水的利用率,增加新的水资源。

四、小结

厂商共同排污、代表政府的自来水公司进行城市供水、政府与厂商之间的博弈等都是公共水资源问题的表现。若使水资源可持续开发利用,第一,制定合理的排污收费制度或实行排污许可证交易促使用水单位合理排污,同时调整产业结构及集中治理治污,解决用水紧张以及污染严重等问题。第二,政府制定统一合理的水价或实行水权交易使水资源在各用水单位的配置合理,指导自来水公司之间重组,扩大规模,减少公司数量,提高效益,同时节约水资源。第三,在厂商与政府的动态博弈中,尽量减少政府失灵,制定高额罚款标准,严厉的法律制裁及执行程序,同时减少水资源管理中的寻租行为,使之成为该博弈中的可信威胁,使博弈提前结束。第四,设计水资源保护机制,怎样规则最有效,底价、投标费、保证金等定在多少较合理,以使得拍卖方达到盈利极大化就是拍卖形式的机制设计等。总之要做到水资源开发、利用和保护协调发展,政府、社会和公民必须在水资源保护和利用过程中,更加开阔思路,减少错误决策,提高行动效率,使得博弈各方利益都得到最好的保护,以实现人与水资源开发利用的和谐发展。

[1]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.

[2]Roger Perman. Natural resource and environment economics [M].second edition , December 1998.

[3]张焕林.探析规划水资源论证的政策框架构成[J].水利发展研究,2010(4).

[4]王金南.排污收费理论学[M].北京:中国环境科学出版社,1997.

第8篇

[关键词] 订单农业 农业产业化 博弈论

在我国农业产业化过程中订单农业是居于主要形式的,其未来的发展对我国农业产业化进程至关重要。在订单农业中最为关键的就是农户与农业加工企业间的关系,“农+企”的关系构成了订单农业的核心。目前在我国订单农业中农户与农业企业间的关系并不是很稳定的,在一定范围中存在着履约率低的现象,这严重束缚了订单农业在我国的进一步发展。

一、订单农业中“农+企”关系的现状介绍

订单农业目前出现了履约率较低的现象,究其原因是复杂的。主要表现在:当原料市场价格高的时候,哪家企业出的价格高,农民就把农产品卖给那家企业,不履行合同中规定的义务,进而会出现几家企业甚至地区间企业抢购原料的无序竞争状态;当原料市场价格低的时候,企业又不愿敞开收购或压级压价收购,变相不履行合同,造成订单农业执行难,产生大量的经济纠纷,束缚了当地订单农业的进一步发展。

二、订单农业中“农+企”关系矛盾的博弈分析

我们就以农产品加工企业和当地的种植农民之间的关系作为例子,运用博弈论的知识来对此加以分析:假定在这场博弈中有两个博弈的参与者,一个是种植农户,简称博弈参与者A;另一个是当地收购并且加的企业,简称博弈参与者B。同时假定在这个博弈过程中双方享有的信息是平等的,不存在任何一方占有信息优势。对于参与者A和B来说,都有两种可供选择的博弈策略:履约和不履约。由此,可得关于A,B博弈参与者的收益矩阵:(见表1)

表1 A、B博弈参与者的收益矩阵(注:b>a>d>c)

由上表中关于博弈参与者A,B的收益矩阵可知,当博弈参与者B遵守合同时,A遵守合同获得的收益为a,不遵守合同获得的收益为b,因为b>a,在此情况下A作为一个理性的人来讲会选择不遵守合同;当博弈参与者B不遵守合同时,A遵守合同获得的收益为c,不遵守合同获得的收益为d,因为d>c,在此情况下A作为一个理性人会选择不遵守合同。这样,对于博弈参与者A来讲,不管博弈参与者B采取何种博弈策略,它的最优策略是不遵守合同较为有利。同样,对于博弈参与者B而言,最优策略也是不遵守合同较为有利。

综上,在该博弈里,对于博弈的参与双方而言,各自的最优策略都是不遵守合同,这样得到一个纳什均衡博弈结果,此时双方的收益为(d,d)。由收益矩阵可知,该博弈的最优均衡结果是双方都选择遵守合同的策略,相应的收益为(a,a)。因而,此种博弈的纳什均衡并不是最优的纳什均衡结果。

三、增加外部干预措施后的博弈分析

导致前面博弈没有取得最优均衡结果的根本原因是:博弈双方的利益分配得不合理,增加了博弈双方的违约动机。如果我们能对博弈棋局的外部采取干预措施来改变博弈双方的利益分配格局,进而降低博弈双方的违约动机,就有可能使双方的收益达到最优的均衡博弈结果,即双方将都从干预中获益。

下面我们就以对博弈参与双方的违约行为采用高额罚金进行处罚的干预方式作为例子来分析利益双方的博弈行为。

假定在博弈的一方遵守合同而另一方违约的情况下,违约的一方将面临高额罚金(假如该罚金为),同时该罚金的所得都用于补偿遵守合同的另一方的利益损失。此时违约的一方所获得的收益为,遵守合同的另一方的收益为,其他情况则保持不变(收益矩阵见表2)。

表2 收益调整后博弈参与者A,B的收益矩阵

下面分析的不同取值对博弈双方最终博弈结果的影响:

1.当时。在此条件下我们很容易得出结果:对于博弈双方AB来说,不管对方采取何种博弈策略,它都会选择不遵守合同的博弈策略。这样,最终博弈双方的均衡结果与先前的博弈结果是相同的,此时该种干预措施的效果是比较差的。

2.当时。对于博弈的参与者A来说,当博弈参与者B遵守合同时,它遵守合同获得的收益a要大于不遵守合同获得的收益,从理性人的角度来看,A会选择遵守合同的博弈策略;当B不遵守合同时,它遵守合同获得的收益要大于不遵守合同获得的收益d,此时A同样会选择遵守合同的博弈策略。即不管B采取何种策略,A都会选择遵守合同的博弈策略。同理,对B加以分析,也会得到相同的结果。这样,最终博弈双方的均衡结果是最优纳什均衡,即大家都选择了遵守合同的博弈策略,最终收益为(a,a)是最优的,即该种干预措施对利益双方都是有利的。

3.当时。分析结果是此时博弈双方无最终的均衡博弈结果,也就是说此时的博弈结果是不确定的,因而此时该种干预措施的效果也就是不确定的。

综上所述,适当增加干预条件,当罚金值满足的条件时,经过收益调整后的博弈双方就会得到一个最优的纳什均衡,此时双方也将会从该博弈中获得最大的收益。

四、对策与建议

我们论证了:通过外界的干预措施来降低博弈双方违约的动机是解决先前的非最优均衡博弈结果的有效方法[4]。具体的干预方法和措施主要有:

1.增加博弈双方的违约成本,降低违约动机

(1)可以设立一个中介机构,比如称为农产品交易中心,通过以该交易中心为中介,来完成双方的交易(这有点像期货交易中的清算所的作用,具体见图)。这样不论哪一方都不会轻易的违约,因为保证金会作为它们违约的代价。同时也避免了违约金被长期占用的情况,双方履约完成后保证金会自动退回双方。而且,交易的双方可以互相选择交易对象,有利于农户维护自身的权利,改善了单个农户与企业之间订立合同时所处的劣势。

设有农产品交易中心的订单农业示意图

(2)建立农户和企业的信用档案。如果发现农户或者企业在履约时出现违约的现象,可以在它们的信用档案中加以记录。对有违约现象等不良记录的农户,从信用社或银行获取贷款时,将增加贷款的审核条件,在贷款利率、期限和贷款使用途径等方面有更严格的要求。通过这种方式,增加相关农户和企业违约的成本,提高履约率。

(3)通过设立农户自律组织来增加双方的违约成本。通过协会的形式来规范农户自身的行为,同时当农户面临农业企业的变相违约时,可以以协会为主体,采取集体性的措施,维护自身的权利。当然,对于农业生产中介组织这个领域,目前我国的发展还处于起步和探索阶段,要真正在实践中做好还是比较难的。

2.通过更为科学的合同定价来降低博弈双方的违约动机。通过分析,我们会发现导致种种利益矛盾的另外一个根本的症结是合同中所采用的固定价格机制,而这与市场中相关农产品价格的波动是有冲突的,这也导致了双方利益关系的不稳定甚至出现利益冲突。

(1)将合同中的固定价格转化为浮动价格。如果把合同中的固定价格转化为浮动价格,这样农民和企业之间就不会产生因为市场价格变化,而导致双方之间的利益冲突。主要是通过期货交易,来达到对该农产品的价格进行套期保值的效果,锁定该农产品的未来价格。

(2)在合同中设立附加条款,避免合同双方利益的过度不平衡,进而可以减少双方的违约动机。比如可以在合同中规定,当市场价格处于合同规定价格的10%(或者是其他比例数额)波动范围内时,双方交易的价格仍以合同规定的价格为基准;超过波动范围时,此时双方交易的价格就以另一种计价方式来计价。这样,避免了因为市场价格的大幅度变化,出现一方获得较大收益,而另一方则面临着相应的大幅度亏损的不利局面,有利于提高合同双方的履约率。

五、结束语

从上面的分析中可以看出,导致当前“农+企”关系面临困境的主要原因是其中的制度设计和执行方面存在着缺陷。所以,对于这种由于制度缺陷原因而导致的困局我们应主要从纠正制度缺陷方面入手来加以解决,即通过改变博弈双方不合理的收益分配格局,以此来降低双方的违约动机,实现最优纳什均衡。

参考文献:

[1]祝宏辉:新疆番茄产业实施订单农业生产方式的效果评析[J].农业技术经济.2007(3):89-95

[2](美)朱・弗登博格,(法)让・梯若尔.博弈论[M].北京:中国人民大学出版社,2002

[3]杨鹏飞:发展农业产业化之我见[J].内蒙古农业科技,2003(6):153-154

[4](美)约翰・海萨尼.海萨尼博弈论论文集[M].北京:首都经济贸易大学出版社,2003

第9篇

〔关键词〕图书馆;数据库商;博弈论;囚徒困境

DOI:10.3969/j.issn.1008-0821.2015.07.003

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2015)07-0014-05

〔Abstract〕The game theory model of the libraries and the database vendors is formulated in this article,it also pointed out the prisoners dilemma was the Nash equilibrium of the game between the libraries and the database vendors,it analysed the causes of the prisoners dilemma and also had an analysis of the possibility and necessity to break prisoners dilemma between the libraries and the database vendors.Based on the perspective of Karldor Hicks Priciple,some strategies to break prisoners dilemma were proposed.

〔Key words〕library;database vendor;game theory;prisoners dilemma

版权法的立法目标是要禁止对作品的无偿使用又要保障知识的自由传递,对于数据库这类汇编作品,版权法只保护对事实的选择和编排形式而不保护数据库作品中的事实本身[1]。但是,欧盟于1996年颁布了数据库指令,该数据库指令创设了一个数据库特殊权利,这一权利意味着把数据库制作者的权利延伸到了数据库中的信息内容本身[2]。欧盟颁布的数据库指令加大了数据库商版权保护和图书馆信息获取之间的固有冲突,使得图书馆与数据库商之间的博弈竞局凸显[3]。

1 图书馆与数据库商的博弈分析

11 博弈竞局产生

1996年欧盟颁布的数据库指令,创设了一个数据库特殊权利,这一权利加强了对数据库商的保护力度,使得更多的数据库成果被创造出来,推动了数据库产业的发展。图书馆与图书馆用户是数据库资源的最终消费者,是数据库产业发展的根本动力,他们的利益代表着社会的公共利益,希望获取更多的数据库信息资源以促进知识的传播和科学技术的进步;而数据库商是数据库信息资源的所有者,希望凭借数据库保护条例,阻止公众对其数据库内容的免费使用。因此,在数字环境下,要平衡数据库商追求的私人利益和图书馆代表的社会整体利益,不能一味地强调一方的利益而削弱另一方的利益。由于图书馆与数据库商的利益诉求不同,图书馆所代表的社会整体利益与数据库商的个人利益的矛盾导致二者之间博弈关系的产生,即数据库商与图书馆之间的博弈竞局产生。

12 纳什均衡的“囚徒困境”

博弈论的理论认为,在竞争关系的非合作博弈中,由于每个博弈决策参与人都充盈着自由自觉的意识,但这种自觉意识是原子形态的意识,无法形成合作的有机分子结构或集体理性。因此,在竞争关系的非合作博弈中,决策参与人认为对手欲置自己于最不利的状态,所以,博弈决策参与人要通过对方案进行选择以谋求收益的最大化,这样做的结果反而使博弈各方最终选择了对自己较劣的策略,并造成了对集体利益的严重破坏[4]。图书馆与数据库商之间进行的数据库买卖的交易活动,实质上就是一种双方利益的博弈,在双方博弈的过程中,每一方既可以采用合作的策略,也可以采用不合作的策略,为表述方便,将双方博弈情况用图1说明。如果一方合作、另一方不合作:合作方得1分,不合作方得5分;双方都合作:各得4分;双方都不合作:各得2分。

从社会整体效用的视角可以看出:(4,4)>(5,1)>(1,5)>(2,2)。可见,图书馆与数据库商都选择合作策略时,社会整体效用最大;但图书馆与数据库商都选择“不合作”策略,这对双方来说都是超优策略,即最符合他们个体理性的选择,按照博弈论的说法,这是惟一的纳什均衡点(不合作,不合作)。除了这个纳什均衡点,图书馆与数据库商任何一方单方面改变策略选择,只会使其得到更加不经济的结果[6]。而在其它的策略组合中,比如双方都选择“合作”策略的情况下,都存在其中一方可以通过单方面改变策略选择,来增大自己的效用的机会,因此,策略组合(合作,合作)显然不是纳什均衡点,不可能会被自动实施。图书馆与数据库商经过理性分析后,肯定选择惟一的纳什均衡点(不合作,不合作),即双方博弈陷入“囚徒困境”。

13 “囚徒困境”的后果

分析图1图书馆与数据库商竞争博弈的效用矩阵可知,图书馆和数据库商都选择“不合作”策略,这对双方来说都是超优策略,即最符合他们个体理性的选择,按照博弈论的说法,这是惟一的纳什均衡点(不合作,不合作)。图书馆和数据库商经过一番理性计算后,肯定选择惟一的纳什均衡点(不合作,不合作),以为图书馆和数据库商要追求个体效用的最大化,但图书馆与数据库商单方利益的最大化并非社会整体利益的最优选择,从本质上看,是一种“没有效率”均衡状态,即非“帕累托最优”状态[7]。所以,图书馆与数据库商竞争博弈均衡的“囚徒困境”反映的是因个体理性的扩张而导致集体理性的缺失,对整个社会的影响是消极的,极易产生数据库产业的垄断和图书馆以及社会公众的反感,造成社会净福利的损失。为提高整个社会的信息福利水平,实现社会整体利益的“帕累托改进”,必须思考如何破解图书馆与数据库商竞争博弈均衡的“囚徒困境”。

2 产生“囚徒困境”的原因

21 经济人的逐利本性

经济学鼻祖亚当・斯密认为:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳的经济后果。”[8]按照亚当・斯密的观点,人的经济行为的根本动机是自利,每个人都有权追求自己的利益,没有自私社会就不会进步。但是“囚徒困境”恰恰表明个体理性不能通过市场导致社会福利水平实现“帕累托最优”状态,所以说经济人的逐利本性会导致社会整体利益缺失的“囚徒困境”的恶果,这一点与儒家主张的“财自道生,利缘义取”的观点相抵触,即儒家反对个体私利的无限扩张,倡导社会整体公益的提升[9]。佛家讲因果律,从“囚徒困境”的结果来看,如果个体一味地想算计别人,算来算去,最后必然导致自身效用的丧失,“机关算尽太聪明,反误了卿卿性命”用在“囚徒困境”的结局是再恰当不过的了。如图2所示,图书馆追求社会公共权利的扩张,而数据库商追求个人私权利的扩张。X轴代表数据库商追求的个人私权利,Y轴代表图书馆追求的社会公共权利,M点代表绝对追求社会公共权利,N点代表绝对追求个人私权利,并且a=b。图书馆与数据库商双方都希望实现自身追求的权利的最大扩张,但是,双方权利都实现最大扩张却不可能存在,及M点与N点不可能重合。正如英国经济学家科斯主张:不同权利之间不存在绝对清晰的界限,在法律保护一种权利时,必定会损害另一种权利[10]。因此,当图书馆与数据库商都想扩张自身权利的同时,必然导致双方都受损的“负和博弈”结果,即数据库商与图书馆双方的利益都受损的“囚徒困境”结局。

22 对合作共赢前景的不信任

从图书馆与数据库商博弈均衡的“囚徒困境”来看,图书馆与数据库商竞争博弈的纳什均衡,从本质上看,是一种“没有效率”的均衡状态,即图书馆与数据库商单方利益的最大化并非社会整体利益的最优选择,我们有必要对这种(不合作,不合作)的纳什均衡进行帕累托改进。

根据意大利经济学家维弗雷多・帕累托的观点:在未达到“帕累托最优”状态前,能够朝着“帕累托最优”状态方向前进的行为,叫作“帕累托改进”[7]。图书馆与数据库商博弈的帕累托最优状态,无疑是图书馆与数据库商追求的目标,但在现实的图书馆与数据库商的协同竞争中,帕累托最优状态往往难以实现,因为按照帕累托最优的标准,实行“帕累托改进”是要在绝对公平的前提下不断提高效率,而图书馆与数据库商代表着两种利益的博弈,图书馆代表信息公权,数据库商代表信息私权,如果做到绝对公平的“帕累托最优”,那么对数据库版权保护的保护力度在图2中只能保持在P点(因为a=b),但图书馆与数据库商都明白这种绝对公平的“帕累托最优”是很难实现的,即使在某一时刻实现了,也是不稳定的,基于这种对“帕累托最优”状态实现的认识,双方都不可避免地力图扩张自身权利,因此“囚徒困境”结局必然产生[11]。

3 “囚徒困境”的破解

31 破解“囚徒困境”的可能性

20世纪初,意大利经济学家维弗雷多・帕累托提出“帕累托最优”状态的概念:如果一个人可以在不使任何其他人的处境变差的前提下而使自己的处境变得更好,那么,这种状态就是“帕累托最优”状态[12]。图书馆与数据库商合作双赢的理想状态应该是帕累托最优状态,即福利经济学中资源分配的理想状态。按照帕累托标准来分析图书馆与数据库商的博弈问题,必须兼顾双方利益,才是最有效率的,如果以损害一方利益为代价,来改善另一方利益的方法实质上是没有效率的。设定以下经济模型:Z代表图书馆追求的社会整体利益,G代表数据库商追求的私人利益,X轴代表对数据库的保护力度,C(x)代表数据库版权保护所付出的成本,则有函数图像如图3所示。

图3 图书馆与数据库商合作博弈的理想状态[5]

观察图3的函数图像可以看出,私人利益G的函数曲线随着保护力度的增大而增大,并趋于正比例上升,所以,随着对数据库保护力度的增加,数据库商的私人利益会逐渐增大。用x表示X轴上的任意一点,当xx′时,代表社会整体利益的Z曲线随x值的增大而下降,例如,代表数据库商私人利益曲线G与代表社会整体利益的曲线Z的交点r,就表示因对数据库版权的过度保护而导致社会整体利益下降的状态。只有当x=x′时,才能做到既保护了数据库商的私人利益,又实现了图书馆追求的社会整体利益的最大化,因为x′点对应的y′值是曲线Z的波峰值,是使边际产出MZ(x′)等于边际成本MC(x′)的社会利益点,也是图书馆追求的社会利益Z与数据库追求的私人利益G之差最大化的点,当x=x′时,Z(x′)-G(x′)≥Z(x)-G(x),即当x=x′时,Q(x′,y′)点获得的总效用不低于其他各点时获得的总效用[13]。因此,x′值代表对数据库版权保护的帕累托最优状态,x′值体现了图书馆与数据库商合作博弈公平与效率的理想状态,因为当保护力度x=x′时,做到了既保障了社会整体利益又保障了数据库商的私人利益,即既能保障图书馆用户对数据库信息内容的获取,又不会影响数据库商的私人利益,因此,对数据库的保护力度值x

32 破解“囚徒困境”的必然性

图书馆代表的社会公权与数据库商对数据库资源的合理收费并不矛盾,相反,对数据库资源适当收费可以实现信息价值的货币化,减缓数据库开发的成本压力,改善数据库资源的供给结构,使图书馆的用户可以获得更好、更多的数据库信息内容。由于数据库产品的特点是高固定成本,低边际成本,因此不能用边际成本作为对数据库定价的标准,而必须按照用户对数据库价值的评价来定价[14]。但是,多数数据库商忽略用户对数据库价值的评价,为了实现自身收益的最大化,不当使用数据库销售定价策略,对数据库产品定价过高,引发了与图书馆之间的矛盾。观察图2可知:当线段OP到达P(a,b)点后,如果数据库商继续通过提高数据库产品的价格来扩大自身收益,必然会引起图书馆所代表的公共利益的下降,引起图书馆界的不满而采用联合抵制行为,即图书馆与数据库商之间的博弈由合作状态转向竞争状态,数据库商追求的私人利益反而不会兑现,如图1所示的纳什均衡的“囚徒困境”凸显,双方博弈的均衡结果是图1中的(不合作,不合作)策略组合,显然,双方都没有实现自身收益的最大化,最终的结果却是两败俱伤。

罗伯特・爱克斯罗德教授在研究人类合作之前,设定了两个前提:第一,人都是自私的;第二,个人决策不受权威干涉。也就是说,个体能够按照自身利益最大化的企图进行决策,这完全遵循博弈论的基本思想。爱克斯罗德为了研究:人为什么要合作?人在什么时候选择合作?什么时候选择不合作等问题设计了一种游戏,邀请社会各界的专家参加游戏程序的设计。这个游戏共分两轮,第一轮游戏共15个程序参加,运转了200次,结果是加拿大学者罗伯布编写的针锋相对策略的游戏程序获胜,针锋相对(tit-for-tat)策略即“胡萝卜加大棒策略”。针锋相对策略向我们证明一个纯粹自利的人也可以选择善,因为合作是自我利益最大化的一种必要手段[15]。因此,只要图书馆与数据库商建立持久数据库交易关系,双方都会基于维持自身声誉的原则尽量不首先选择不合作策略,以免承担道德压力和法律制裁,这样基于长远合作利益的角度,双方具有合作的动力。根据以上的分析可知,只要图书馆与数据库商的数据库交易关系建立长效机制,力争博弈重复无穷次,使得双方清楚:数据库的交易是长期合作行为,任何方偷偷实行了“不合作”策略,将会得到对方报复,偷偷实行了“不合作”策略的一方的长期效用将会小于选择“合作”策略时的长期效用,在长期的动态博弈中,如果图书馆与数据库商都采用针锋相对策略,博弈的结局也就是纳什均衡点将是双方都选择“合作”策略,此时图书馆与数据库商的博弈必然走出“囚徒困境”。

33 破解“囚徒困境”的策略

331 图书馆主动维护数据库版权

合作是文明的基础,哲学家卢梭的《社会契约论》指出契约是合作基础,数据库版权保护条例本身就是一种契约,只要图书馆遵守数据库版权保护规定,“囚徒困境”自然就会破解。观察图2可知,线段OP表示图书馆与数据库商之间的合作关系,此时双方追求的个人私权和社会公共权可以同时实现。根据图3的函数图像也可知:当x

332 数据库商主动让渡版权收益

基于卡尔多-希克斯效率的“帕累托改进”模式,即数据库商要制定合理的定价策略,数据库价格过高时要适当降价,主动让渡版权收益[16]。正如国外学者的观点:“公共信息的利用应该在透明和合理的价格机制下通过各种技术形式和许可方式来提高获取和再利用。”[17]所以,数据库商即使从扩大自身收益的视角看,也必须考虑制定合理的定价策略,必须考察作为公益事业单位的图书馆的经济承受能力,必要时要合理降价,特别是针对众多图书馆的集团购买行为,数据库商更要合理降价。由此看来,对数据库产品采取合理的定价方式,并且必要时合理降价,一方面可以对数据库商版权的独占性进行保护;另一方面,可以促进图书馆用户对数据库内容的有效获取和应用,避免因数据库版权的过度保护而导致知识传播与科技发展的障碍,充分降低数据库版权过度保护的消极作用,破解博弈的“囚徒困境”。

333 依法约束双方的行为

西方哲学家卢梭说过:究竟是什么使人类找到一种方法,通过强迫人们服从,从而使他们获得自由[18]?法律作为一种机制设计,其本身就代表多方利益的博弈,在对数据库保护的执法实践中必须坚持权利规制和权利保护并重的原则,即在依法保障数据库商充分行使其数据库的知识产权的同时,要有效制止和惩戒其权利滥用行为[19]。如图3所示,当x

334 采用合理补偿机制

经济学家卡尔多和希克斯在对“帕累托最优”标准进行研究的基础上,提出了卡尔多-希克斯补偿效率标准。卡尔多-希克斯效率的含义是:可以使一些人受损,另一些人受益,但总体收益要大于损失,并且可以用获得的收益对所受到的损失进行补偿,以实现社会总福利的增加[12]。由此看来,卡尔多-希克斯补偿理论是一种次优的平衡。虽然理论上“帕累托最优”标准是协调图书馆与数据库商竞争与协同关系的理想目标,但从实践上看,卡尔多-希克斯补偿效率标准更具有实际应用的价值。如图2所示,线段OP部分既保证了图书馆的公权又保护了数据库商的私权,从O(0,0)点到P(a,b)点是一个“帕累托改进”过程,P(a,b)点是“帕累托最优”状态,即P(a,b)点再也无法依据“帕累托最优”标准进行“帕累托改进”。线段PM代表图书馆的公权大于数据库商的私权,虽然线段PM强调图书馆的公权必定会侵犯数据库商的私权,但却有利于社会整体信息福利的增加,如果能够从社会整体信息福利增加的结果中对数据库商给予适度的补偿,这无疑就是一种基于卡尔多-希克斯效率的“帕累托改进”,是一种次优的平衡,是现实的“帕累托改进”路径,同时自然也会破解双方博弈的“囚徒困境”。

335 促进信息的有效沟通

虽然数据库商与图书馆之间的矛盾与冲突蕴含着个体利益与社会整体利益之间的博弈,但是二者之间并不是不可调和的敌对关系,因此,数据库商与图书馆之间都不希望出现双方都受损的“囚徒困境”结果。为了避免“囚徒困境”的结局出现,双方之间必须建立有效的信息沟通渠道,主动协调利益关系:要让对方清楚,自身首先要善意而不是恶意地对待他方,但是一旦发现他方采取了不合作策略,也会斩钉截铁地进行报复,这样的结果必然是形成两败俱伤的“囚徒困境”。通过有效的沟通让对方了解己方的态度,必然会减少因信息沟通不畅而导致的误解,避免出现错误的策略选择。因此,只要数据库商与图书馆都有明晰的个性和坦诚的态度对待双方的合作,能够在数据库的交易活动中及时沟通,相互体谅,消除误会,必然会走出博弈的“囚徒困境”。

参考文献

[1]李明德,许超.著作权法[M].北京:法律出版社,2003:27.

[2]张伟君.版权保护对信息获取的制约及其反垄断法规制[J].信息网络安全,2009,(2):56-59.

[3]张伟君.版权扩张对信息获取的影响及其反垄断法规制[J].科技与法律,2006,(1):32-35.

[4]Geoffroy de clippel.Values for Cooperative Games with in Complete Information:An Eloquent Example[J].Journal of Translation From Foreign Literatures of Economics,2006,(1):73-82.

[5]孙瑞英.网络信息资源共享与版权保护的博弈双赢研究[J].情报理论与实践,2013,(12):30-34.

[6]孙瑞英,马海群.文献信息资源共享的博弈分析及管理机制设计研究[J].情报资料工作,2009,(2):40-41.

[7]李绍荣.帕累托最优与一般均衡最优之差异[J].经济科学,2002,(2):75-80.

[8]李黎力,张红梅.亚当・斯密“看不见的手”及其批判述评[J].经济与管理评论,2014,(9):31-36.

[9]张红明,朱丽贤.商业伦理的中西方比较研究[J].经济经纬,2005,(6):143-146.

[10]熊艳玲.论版权保护与信息资源共享的利益冲突及平衡[D].湘潭:湘潭大学硕士论文,2004:16.

[11]高月兰.对“帕累托最优”的伦理诘问[J].河北理工大学学报:社会科学版,2005,(8):18-20.

[12]朱富强.效率原则是否为指度制度改革的合理原则――社会总效率和帕累托效率的实践后果解析[J].制度经济学研究,2010,(6):185-207.

[13]斯蒂格利茨.经济学:上册[M].第3版.北京:中国人民大学出版社,2005:214-229.

[14]万静.电子期刊定价研究[J].情报理论与实践,2008,(3):344-346.

[15]王则柯.新编博弈论平话[M].北京:中信出版社,2003:18-27.

[16]陈传夫,等.图书馆知识产权管理方案优化研究[J].国家图书馆学刊,2009,(2):23-27.

[17]窦曦骞.浅析电子文献产品的定价模式[J].情报理论与实践,2008,(5):675-679.

[18]高全喜.法律与自由[J].学海,2006,(2):86-102.

相关文章
相关期刊