欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

博弈论方法优选九篇

时间:2024-03-28 11:09:50

博弈论方法

博弈论方法第1篇

摘要:博弈论在新闻传播研究中具有方法论、学科拓展的重要意义。近年来,虽然博弈论在理论研究中取得了一定的成果,但质和量上还存在较大的发展空间。新闻理论界对博弈论的理解存在狭义、广义与日常通俗语义基础上的三个层面水平。我们可从哲学意义、方法论意义和建构意义三方面,认识博弈论在新闻传播学研究中运用的可能性。

关键词:新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路,在上个世纪80年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间,涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90年代之后,有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物,这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视,是在2004年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008年10月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度,来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象,对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行,通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发,来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题,传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象,也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素,但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面,来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想,扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律,调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况?其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素,正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具,人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点,自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播用学派的传播模式研究,实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中,许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式,第二版介绍了66个传播模式。除了个别早期线性模式外,在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维,其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代,在需要破除自然与社会科学鸿沟的时代,谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视,将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”,进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献:

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

2.施锡铨著:《博弈论》,上海财经大学出版社,2000年版。

3.罗伯特·吉本斯[美]著、高峰译:《博弈论基础》,中国社会科学出版社,1999年版。

博弈论方法第2篇

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路, 在上个世纪80 年代社会 科学 方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心 理学 、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间, 涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90 年代之后, 有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物, 这些书籍大都将社会生活、 经济 领域、 历史 经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视, 是在2004 年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008 年10 月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度, 来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象, 对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行, 通过大量案例剖析与实战推演, 总结 出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括 网络 媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发, 来探讨新闻传播领域中,如何把握新闻活动的 规律 ,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题, 传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象, 也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素, 但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面, 来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想, 扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律, 调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况? 其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学 意义。马克思主义强调 经济 基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会 历史 的 发展 有着诸多的因素, 正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会 科学 理论范式也有一个工具理性与价值理性的统一问题。

博弈论方法第3篇

[关键词]博弈论;理性人假定;公共知识;社会科学方法论

[中图分类号]C3

[文献标识码]A

[文章编号]1671-511X(2012)04-0020-03

博弈论是研究理性人的互动的理论,或者说研究交互决策的理论。1928年,冯·诺依曼证明了博弈论的基本原理,宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统应用于经济领域,奠定了这一学科的基础和理论体系。1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚定的基础。塞尔顿、哈桑尼、谢林、奥曼等人的研究也大大推动了博弈论的发展。因此,尽管博弈论是一门新生的学科,但是它今天已经发展成为有较完善的理论体系的科学。

今天,博弈论已经成为社会科学的通用方法论。尽管它是演绎科学,对社会现象有强大的解释力,然而,由于其理想主体的假定使得其演绎出的理论解与实际博弈结果存在差异。许多实验经济学家通过博弈实验研究实际中人们的博弈过程,分析博弈论的演绎解与博弈实验结果之间的差异。如2002年诺贝尔经济学奖就颁发给了丹尼尔·卡尼曼和迈农·史密斯,他们是实验经济学的先驱。今天在西方学术界通过实验来验证博弈的理论结果已经成为一种潮流。本文下面设计并进行了一个博弈实验,通过分析实验结果与理论解的差异,分析博弈论作为社会科学方法论的局限性,并提出改进的可能路径。

一、博弈实验及结果分析

1 实验描述

我们设计了如下的一个博弈实验。该实验的参与人是南京大学选修文化素质课“逻辑与科学方法基础”的大学生,他们是二三年级的学生,文理科学生均有。

该实验是以试题的形式进行的,该试题作为期末试卷中的最后一道题。该题目为:

在0-100之间选择一个数字,规则是:若你选择的数字“是或最接近”在座同学所选择的数字的平均数的2/3(即在座同学所选数的总和除以总人数之后所得数字的2/3,如:若平均数为90,你应当选2/3×90=60),你将获胜。请给出你选择的理由。

实验说明:

(1)实验参与者即参加考试的学生,事前不知道这是一个实验;

(2)该课程教师以讲座的形式给实验参与者传授过博弈论知识,但没有提到所进行的博弈;

(3)因为(2),他们中的大多数掌握“博弈”、“公共知识”等概念;

(4)试卷是保密的,没有任何学生预先知道考试内容,考试过程中学生间无任何交流;

(5)该博弈的理论解(即纳什均衡)为0或1。

2 实验结果

对于考试中的每个学生,在这个博弈实验中他能够获胜的关键是,他要准确猜测他人是如何选择的,一旦他猜测正确,他将他猜测的平均数乘以2/3便是获胜答案。

共有176人参加了考试。排除掉5个不明确的选择,供分析的实际选择数为171个(其中3个选择非整数)。实验结果为(按照数字大小排序):

“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

3 结果分析

在这些所选择的数字中,最大的数字为75,最小的数字为0。171个数字相加后的平均数为21.91,本博弈胜出解:21.84×2/3=14.61。

这个博弈中,0和1是均衡解(下一部分将分析),它们是“理论解”。在该实验中,0是所选最多的数字,共有46人选择,比例为26.9%;选1的为14人,比例为8.2%。两者相加共有60人,比例为35.1%。

从上述数据可以看出,在这场博弈中,“实验解”为14.61,最接近该数的是14或15,这和“理论解”的“0”或“1”不同。在本实验中,没有人选择14,而选择15的有3人,这3人是该实验的胜出者。

若按照区间来统计,实验结果的分布情况见表1。本博弈实验的“实验解”14.61落在11-20之间。若我们把11-20看成是胜出区间,则有7人胜出。

对于这些选择,有以下值得注意的几点:

第一,67以上的选择都是不理性的,因为参加考试的学生数为150-200之间,这是公共知识,即使所有的学生都选择100,胜出的数字都不会超过67。但是还有3位学生选择了大于67的数字,其中选择的最大数为75。他们在给出这些选择时没有给出理由。

第二,分析学生所给出这些选择的理由,可以看出,绝大部分选择者在进行他们的选择时考虑到了他人的选择以及他人的推理。不同的人对他人的假定不同,所进行推理的步骤也不同。如选择67的学生假定了他人都选择100,因而选择67是最优选择;再比如选择30-40之间的数字的同学,其理由大体上有两个:或者认为平均数集中在50-60之间,其2/3就集中在35-40之间;或者认为都选100的话,66.7是最优选择,都选择66.7的话,44是最优选择,而都选44的话,33是最优选择。

第三,有三个区间处的选择比例较高:0-10间为38.6%,21-30间为17.6%,31-40间为25.7%。从所给理由可看出,不同区间的选择者考虑群体的互动推理的步骤存在差别,如0-10区间的选择者考虑他人的推理步骤比31-40区间的选择者多些。

第四,值得注意的是,11-20区间里的选择较少(事实上是,在这个博弈中所选择的数字落在这个区间是最有可能胜出的)。原因可能是,一旦选择者进行了多步的互动推理,他们便能够将这样的推理进行下去,从而将选择向理论解0或1靠近。

第五,有一些“智慧的”选择者,他们知道理论解,但他们知道存在不完全理性的选择,因而他们没有选择理论解。尽管他们的选择没有胜出,他们的推理是有智慧的。这里,本文选择了其中2个。一位选择22的学生是这样给出他所选择的理由的:“作为理性人,我不会选择大于2/3×100的数,因为即使所有人都选择最大数,平均数的2/3也不会超过2/3×100。如果大家和我一样理智,那么大家都不会选择大于2/3×100,那么我不会选择大于100×2/3×2/3。因为他们选择最大的他们可能会选的数,平均数的2/3也不会超过2/3×2/3×100。依此类推,如果全班都充分理智,那么全班最终都会选择1,然而我不认为班里的人都是足够理智,故平均数的2/3会大于1。根据两次游戏,平均数的2/3在20~30。如果是我,我会选择靠近20的数,那我就22吧。”一个选择10的学生的理由是:“如果其他人都是随机选择,那么平均数最后可能接近于50,50×2/3≈33。但是,如果所有人都选择接近33的数,那么33为平均数,33×2/3≈22……如此推理应该为1。但是并非所有人均是理性、均会如此计算。我对南大有信心,所以,我将数字选得接近1一点,选10。”

第六,有一些选择是没有考虑到他人的选择。如有这样一些理由:“大家都认为60是及格分,所以我选择59”,“58是我的幸运数字”,等等。

二、博弈的理论解分析

本实验是一个多人完全信息静态博弈:参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果,每一参与者的收益函数在所有参与者之间是公共知识。

在这个实验中,参加考试的176位学生是参与者,每个考生同时对0-100之间的数字进行选择行动,即每个参与者的策略空间Si∈(0,100),即有101种可能的策略。根据所有考生的选择,每个考生最后得出自己的结果,对每个考生来说,结果无非就是,自己的选择是“大家所选数字的平均数的2/3”,胜出;要么与“大家所选数字的平均数的2/3”不一致,失败。

我们假定该博弈的参与人都是绝对理性人(事实上,这个要求在实际中难以达到,这也是本文要得到的一个结论)。

我们来分析绝对理性人的推理过程。

在这个博弈中策略组合有176×101种,每种策略组合下,每个人的收益是公共知识。如:如所有人都选100,平均数为100,此时每人都失败,胜出结果是100×2/3=67;如175人都选100,有一个人选择了67,那么选100的人失败,而选择67的人胜出……所以这些是理性参与人的公共知识。

我们看到,任何人都不应该选67或以上,或者选择67或以上是非理性的,因为所选择的数字的最大平均数为100,此时胜出的数字为67,因此选择67以上而获胜的可能性是没有。因此,作为理性人他们都不会选择67或以上。

每个人都不会选择67或以上,这本身也是公共知识。在这样的公共知识的前提下,45以上的选择都是不合理的,因为对每个人而言,只有在他人都选择67以上,我选择45或以上才是合理的(67的2/3约为45)。

每个人都不会选择45或以上,这本身也是公共知识。于是,每个人都认为不应该选择30或以上。

……

结论是:每个人选择0或1是合理的,它们是该博弈的理论解。

事实上,每个人选择0或都选择1是纳什均衡:对每个人而言,在其他人不改变选择的情况下,当下的选择是最优的。

在所有人均选择0的情况下,因为对于每个人而言,若所有人都选择0的话,0便成为平均数,该数的2/3还是0。这样,他选择0是最优选择:在他人不改变选择的情况下,他改变选择将失败。因此这点构成纳什均衡。

在所有人均选择1的情况下,同样,对于每个人而言,在其他人选择1的情况下,平均数1的2/3为0.67,此时1最接近该数。因此,他选择1是最优选择,并且若他改变了他的选择他将失败。因此,这点也构成纳什均衡。

当然,面对多个纳什均衡,作为理性的参与人作何选择才能胜出呢?具体到这个博弈中,每个人要考虑的是,他选择0还是选择1才能胜出呢?

他会这样思考:没有理由认为其中一个比另外一个更有可能胜出,这样,选择0或1胜出的概率为50%,但是,他人能够与我有同样的想法。既然如此,期望平均数应该为0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,选择0是最优选择。

从上面的分析可见,尽管0和1是纳什均衡点,但选择。是最优选择。

三、改进博弈论的可能路径

本文已经表明,上述博弈是一个完全信息静态博弈,然而,本实验的实验解(14.61)与理论解(0或1)之间发生偏离。本文认为,有两个主要原因:

第一,博弈论中所假定的理想主体与实际中的决策主体不相符合。理想的博弈参与人是绝对理性人;他们能够进行任何有穷步骤的推理,能够分析所有有穷可能的情况,并且他们的推理、分析是在瞬时完成的,而实际博弈中人们是有界理性的。在我们的博弈实验中若参与者是理想主体,他们能够做本文上一部分那样的分析,他们应当知道0和1是均衡解,也能够预测O是最有可能实现的结果。本实验表明,并不是所有人都能够做出这样分析的。并且,在实际中存在完全非理性的选择,如本实验中选择大于67的3人,这不是完全偶然现象。

博弈论方法第4篇

纳什均衡是现代博弈论中的核心内容和重要基础,许多理论研究和应用都是围绕这一基本理论展开或与此相关的。随着博弈论的发展和博弈研究的不断深入,人们意识到这种理论和日常经济生活的联系越来越紧密。博弈论可以揭示众多经济问题内在规律和根源,帮助人们分析经济关系,认识经济现象,评判经济效率,指导人们进行科学的经济决策,无论对企业等实际经济部门的经营活动,还是对政府的管理和政策制度制定,博弈论都有重要的指导意义。要用博弈论解决现实经济中的决策问题,就必须解决博弈模型的理论抽象和架设与经济问题实际情况的差距等问题,而解决这些问题的关键在于如何运用数模的思想抽象出问题中的得益矩阵。本文在博弈论的核心内容纳什均衡的基础上,介绍了纯战略纳什均衡和混合战略纳什均衡的相关理论,针对日常生活中的污水排放问题进行了分析。

二、纳什均衡在经济生活中的具体运用――污水排放问题

博弈的分类方法是多种多样的。根据参与人的多少,可将博弈分为二人博弈和多人博弈;根据参与人是否合作,可将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”,与此相对,允许存在有约束力协议的博弈称为“合作博弈”。“纳什均衡”是非合作博弈理论中最重要的一个解概念。政府应该怎样治理污水排放是当今一个热点,也是本文所探讨的问题。政府和企业之间的关系可以运用经济学上的监督博弈来处理。

这个博弈的参与人包括政府和企业,政府的战略选择是检查或不检查,企业的战略选择是排污或不排污。假设A1是企业治理污水(不排污)所增加的生产成本,如果排污的话,则可以将A1据为所有;A2是政府检查所需成本;W是政府对企业排污所收取的罚款金额;G是企业排污所造成的污染而对社会利益的损害;假设W>A1,且W>A2+G,即政府对排污企业采取重罚措施。下表即为一个对应不同战略组合的得益矩阵。

在得益矩阵中,用p代表检查排污的概率,β代表企业排污的概率。给定p,政府检查(p=1)和不检查(p=0)的期望分别为:

E(1,β)=(W-A2-G)γ+(-A2)(1-β)=(W-G)β+A2

E(0,β)=-Bβ+0(1-β)=-Bβ

由E(1,β)=E(0,β),得β*=A2/W。可以采取两种举措:

采取重罚措施;即降低检查成本A2。另外,给定政府检查的概率θ,企业选择排污(β=1)和不排污(β=0)的期望收益分别为:

E1(p,1)=(A1-W)p+C1(1-p)=A1-W・p

E1(p,0)=0

由E1(P,1)=E(P,0)得P*=A1/G,即在现实经济中有许多企业和企业排污所取得的罚款金额W有关,对排污的惩罚越重,企业因排污所获得的生产成本越少,企业的排污概率就越小。

实际上,政府在治理企业排污的时候,应设法考虑收益权的收益问题。由于国民待遇的要求,不可能因企业性质不同而采取不同的罚款数量。所以解决这个问题只能采用行政手段。

同时也要注意地方政府在治理污水中的角色。首先,地方政府的行为要受制于中央政府既定的制度。其次,地方政府亦可亲自组织创新或担当起制度创新的重任。最后,地方政府是制度的推行维护者,对违法排污者实施重罚。

三、主要结论和后续工作展望

博弈论方法第5篇

关键词:新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路,在上个世纪80年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间,涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90年代之后,有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物,这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视,是在2004年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008年10月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度,来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象,对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行,通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发,来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题,传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象,也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。[]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素,但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面,来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想,扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律,调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况?其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素,正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具,人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点,自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究,实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中,许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式,第二版介绍了66个传播模式。除了个别早期线性模式外,在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维,其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代,在需要破除自然与社会科学鸿沟的时代,谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。超级秘书网

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视,将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”,进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献:

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

2.施锡铨著:《博弈论》,上海财经大学出版社,2000年版。

博弈论方法第6篇

一、抓住学生的共性

大学生具有强烈的关注现实问题的意愿,对社会热点问题表现出极高的兴趣,尤其在理解焦点问题时具有很强的可塑性和认知共性。因而应牢牢抓住这一共性,迎合学生在知识需求上的实用化和功利化的特点,从当前丰富的信息资源中寻找承载博弈论知识的现实问题,以期收到事半功倍的教学效果。在教学实践中,笔者把丰田汽车赔偿、西南五省大旱、相亲类节目《非诚勿扰》、2008股市大跌等现实热点都搬上了讲台。下面,笔者就通过教学实例进行说明。

在讲授2005年诺贝尔经济学奖得主托马斯・谢林(Thomas C. Schelling)的博弈承诺及其可信性概念时,笔者以制定《反国家分裂法》为典型案例进行分析。由于祖国统一问题是所有国人关心的国家大事,大学生也不例外,所以讲授过程非常顺利,以致学生在课后反馈中把这一案例列为讲授最成功的部分。接着,为了讲解如何应用可信承诺处理现实问题,笔者选择了电视连续剧《老大的幸福》第四集中的一个视频片段,进一步强化了知识点。实践证明,人物生动的形象在给课堂增添活跃气氛的同时,也很好地承载了传递知识的作用,以缩影的形式把可信承诺的概念和应用可信承诺策略的方法植入了学生的头脑中。最后,笔者以拆迁补偿合同签订中的一种可信承诺策略为例,对本节课进行了总结,并请学生加以点评。由于拆迁问题是当前社会的焦点问题,所以学生对点评表现出极大的兴趣。这样,通过抓住学生的认知共性,展示了可信承诺策略在焦点问题上能够将劣势变为优势的强大作用,成功地引导学生了解并掌握了博弈承诺及其可信性概念。

二、增强主题的典型性和知识模块的简洁性

以经典博弈问题为主题有利于组织素材、选择教学内容,简洁地安排知识模块、弱化知识的层次性有利于照顾各类学生在知识面、综合能力和认知水平上的差异,少而精地选择课程内容有利于突出重点,多角度地反复讲解有利于降低知识门槛,提高学习的效率。

例如:在主题选择上,笔者以多数学生熟知的“囚徒困境”作为第一主题,以试验性强、易于展开的“理性基础和有限理性”作为第二主题,以现实性突出的“重复动态博弈”作为第三主题。由于“囚徒困境”与经济学中的“理性人假设”密不可分,所以第一主题既能让学生感受到博弈问题的趣味性和深刻性,又能激发他们对该主题的进一步思考,使他们逐渐认识到“理性人假设”所具有的超越现实、过于理想的特性,从而部分地为第二和第三主题做好铺垫。另外,有大量关于“囚徒困境”和理性问题的课外资料易于获得,这为学生在课程初期进行兴趣驱动的导读创造了条件。

在知识模块设置上,笔者采取“自成模块、减少关联”的策略。例如:针对非常重要的“信息不对称”主题,我们选择以二手车市场为核心,构建包含药品市场、电脑市场和就业市场等典型主题的知识模块。一方面,这些市场为学生所熟知,易于接受,另一方面,这些市场中包含着非常典型的“信息不对称”因素,因而通过对市场现象的自然描述完全可以弱化学生对经济学市场知识的依赖。为了弱化知识的层次性,突出重点内容,笔者舍弃了理论体系中的某些知识模块,如“海萨尼转换”“斯宾塞信号传递模型”和“斯蒂格利茨信息甄别模型”。

三、重视案例应用,尤其应重视与诺贝尔经济学奖得主有关的案例

博弈论有一个显著特点,那就是它“声名显赫”,并且与诺贝尔经济学奖的关系密切。许多诺贝尔经济学奖得主都曾涉足博弈论领域,在博弈论的建立和发展中直接或间接作出过贡献。“名声在外”为博弈论的诡计公选课的开设提供了有利条件,也为课程的讲授提供了独特的视角和丰富的素材。

纳什是博弈理论发展的划时代人物,纳什均衡是博弈论的核心概念,两者都是公选课中必须包含的内容。为此,笔者设计以下三个环节:(1)借助“囚徒困境”和“情侣博弈”讲授纳什均衡及其不唯一性;(2)播放电影《美丽心灵》,并进行讨论和点评;(3)布置以纳什为主题的案例设计作业,让学生在课堂上演讲。

第一部分是讲解的重点,讲好纳什均衡意味养博弈论课程成功了一半。第二部分可以把人格培养和素质教育有效融合起来,《美丽心灵》不仅能让人体会到学生心灵中因爱而生的温暖,还能给出人生原本就是一场博弈的警示,体现出“大人物小故事”的精髓。纵然纳什这样的天才也有无法摆脱的困境,何况他人?所以,在人生的博弈中,既要承认能力的差异,又要找寻属于自己的色彩。同时还应看到,纵然如纳什般为顽疾所缠都可以逐渐康复,何况其他挫折?所以,要以积极、乐观、健康的心态对待人生,终身学习而不轻言放弃。第三部分是对学生的启发环节。该环节不仅要培养学生对本课程的兴趣,加深学生对知识的理解,还要通过为其提供上台演讲、展示成果的机会,锻炼他们的逻辑思维能力和表达能力。值得一提的是,很多学生在设计案例时自学了有名的“智猪博弈”和“恋爱博弈”等经典模型,巩固了纳什均衡概念,还有学生甚至对纳什曾经设计过的一种“六连棋”博弈游戏进行了分析。

四、重视学科交叉,尤其应重视学科交叉视阈下的学术前沿成果

博弈论己逐渐成为一门为诸多学科提供思维方法和分析技巧的学问,可以说,所有与生命有关的学科都蕴藏着博弈论的应用空间。在公选课中,应重视从学科交叉的视角供给知识,广泛培养各专业学生对课程的兴趣。例如:笔者选择生物演化理论和博弈论交叉所产生的演化博弈论作为知识模块,以人类社会的同性恋演化作为典型主题,挑选最前沿的学术研究案例作为教学的主要内容,为学生进行讲解,扩展了学生的知识面。

在演化博弈论的开创性著作《演化与博弈论》一书中,作者约翰・梅纳德・史密斯(John Mavnard Smith)用精妙的语言、深入浅出的分析和丰富有趣的案例把博弈论的思想融入到生物演化中,推动了对“动物为什么如此”这一问题的深入研究,揭示了动物群体行为演变的动力学机制。笔者首先以“哺乳动物一雄多雌”案例作为引导,简单介绍演化博弈论在性选择和性别比问题上的研究视角以及逻辑结构,然后立刻引出了人类面临的一个有关性的问题――同性恋演化主题下的性问题:从进化论的角度来看,男男同性恋的存在完全没有任何意义,这是因为同性恋相比于异性恋而言成功繁殖后代的可能性太小,那么为什么同性恋的基因没有被淘汰?显然,这一问题接近现实热点,对学生极具诱惑力,而且还具有很强的学术延伸性。为了讲解同性恋基因延续的演化博弈机制,笔者借助2010年2月24日美国心理科学杂志上发表的关于萨摩亚岛上男男同性恋的最新研究成果,利用最前沿的学术案例详细分析了“亲族选择”假说下的演化博弈机制。教学实践表明,通过这样的内容设计,来自不同专业学生的学习兴趣都被调动起来,加深了他们对博弈论的理解,顺利实现了教学的目标。

五、重视开放性,尤其应重视教学信息交流反馈的开放性

信息交流有利于帮助学生巩固所学内容,让有兴趣的学生通过查阅相关资料,获得知识上的感悟和能力上的提升,并逐步脱颖而出。信息反馈有助于教师突出教学的亮点,发现教学中存在的不足,以便在今后的教学中加以改进。

教学实践中,笔者让学生通过电子邮件的形式反馈“课堂心得”,并要求他们同答以下三个问题:(1)这次课对你影响最深或最成功的是哪部分?(2)最失败或可有可无的又是哪部分?(3)对本次课你有什么意见和建议?

这三个问题一方而可以督促学生对课堂内容加以回顾、梳理,另一方而又可以从中发现自己在教学中存在的不足之处。事实上,在交流和反馈中,许多学生都针对课程的内容、进程和教师的教学习惯、技能等提出中肯的批评和建议,帮助教师提高教学水平。这些批评和建议包括讲课的速度有点偏快、思考时间较少、有些理论过于深奥、希望针对时事展开分析、希望多些互动、理论是需要加强的等,当绝大多数学生赞成“少一点数学知识”并希望“讲得详细点”时,笔者采纳了这一建议,并列出了几本偏重数学工具的参考书,让那些“吃不饱”的学生自学。

教学探索与实践的过程是循序渐进的过程,学生在这一过程中所起到的作用是巨大的。只要教师能够及时、充分地了解学生的需求,不断总结、深化课程教学改革的经验,就一定能取得更大的成效。

在缺少合适的教材这一问题上,笔者设想,可以采取灵活性较强的活页方式(如当前许多大学英语教材中都有活页内容)改变这一现状。活页方式既可以突出主题的典型性,又可以涵盖即时事件,满足学生的需要。同时,教材活页的积累还能为课程建设尤其是优质博弈论公选课教材的编著奠定基础。

只要教师能够了解学生的需求,选择恰当的教学方式、方法,不断加以分析、总结,进一步完善教学环节,激发学生的学习兴趣,就一定能顺应高等教育教学改革的趋势,在确保教学质量的基础上,逐渐把博弈论的诡计公选课建设好。

参考文献:

[1]顾建民.高等教育学[M].杭州:浙江人学出版社,2008.

[2]裘松良.转型期高校教育研究与实践[M].北京:高等教育出版社,2010.

[3]胡剑锋.高校经管类教育研究与实践[M].杭州:浙江人学出版社,2011.

[4]潘月明,郭秀芝.人学英语口语公选课教学模式设计与实践[J].高等教育学刊,2009(2).

[5]川浦徐进.本科博弈论教学过程中的案例运用[J].江南人学学报:教育科学版,2009(12).

[6]叶国荣,等.高校本科生教育中研究型教学模式探讨[J].中国高教研究,2009 (3).

博弈论方法第7篇

关键词:博弈论图书馆数字资源资源共享

中图分类号:G251 文献标识码:A 文章编号:1009-3044(2016)29-0017-03

随着大数据时代的到来,信息的互联互通成为提高信息服务能力的重要前提,任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求,也不可能实现对所有资源的收集和管理,数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段,我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面,因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程,是一种分析投入成本和产出收益的博弈过程,通过借鉴博弈论的研究方法,从图书馆个体利益和共享集体利益的关系出发进行研究,可以进一步认识阻碍数字信息资源共享的因素,并找到解决这些问题的方法和措施。

1博弈论概述

1.1博弈论的涵义

博弈论,也称对策论,英文为Game Theory,是根据信息分析及能力判断,研究多个决策主体之间行为的相互影响作用,以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织,在一定的环境条件及规则下,同时或先后、一次或多次,根据环境和竞争对手的情况变化,从各自允许的行为或策略中进行选择、加以实施,并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想,田忌赛马的故事就是较好的博弈论案例。自20世纪80年代,博弈论得到了广泛的应用,尤其对信息经济学的发展做出了重要的贡献。

1.2博弈论“囚徒困境”经典模型分析

博弈论经典模型囚徒困境建立在一个假设之上,即甲、乙两人被怀疑是合伙的偷盗犯,警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据,警方将其分开单独审问,双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人判5年刑。如果两人都不坦白,则警方由Tile据不足,只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程,左方是甲的可选择策略,上方是乙的可选择,双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合,每格第一个数字代表甲的报酬,第二个数代表乙的报酬。比如第二个数字格是指当甲坦白,乙采取不坦白的策略时,甲的报酬为-1,乙的报酬也是-7。图中的报酬均为负数,以表示判刑的年数。

在警方交待了量刑原则以后,会从自身利益出发进行分析,选择坦白或不坦白的策略,此时双方展开了博弈的过程。首先分析甲的思考过程,当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见,当囚犯乙选择了坦白的策略时,囚犯甲坦白则获刑5年,不坦白获刑7年。由此,当乙选择坦白时,甲必然选择坦白(因为5

如果仔细分析囚徒困境报酬矩阵,甲乙双方若都作出不坦白的决定,会得到更好地结果,即各判刑2年。可是因为没办法进行信息沟通,每一方都会担心对方坦白但自己不坦白时会受到重判(即对方坦白获刑1年,自己不坦白则被判7年)。因此,每个囚犯都从个人利益出发考,最终的结果都会选择坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡结果。

囚徒困境的结论折射出的道理发人深省,从个体的视角思考做出的占优策略决定(-5,-5),显然劣于做出合作策略的选择(-2,-2)。换句话说,从单个个体的角度出发得出的占优策略,从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡,体现出了个人理性和集体理性的矛盾冲突。目前,图书馆在数字信息资源共享问题上也存在着类似的矛盾,我们将“囚徒困境”的博弈分析方法运用到资源共享问题上,也可以解释合作的不稳定性及相关问题。

2图书馆数字信息资源共享的博弈分析

2.1数字信息资源共享的静态博弈

数字信息资源共享一直是图书情报界关注的重大课题,每个图书馆都有资源共享的愿望,图书馆信息资源的共享,可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个,分析图2矩阵可以发现,如果A、B馆都选择合作策略,每个参与者均可获得收益为10,总报酬最大为20;如果A、B两者中有一方选择合作,而另一方选择不合作,参与者报酬分另4为6、12,总报酬为18;倘若A、B两馆都做出不合作的选择,那么各馆报酬都是8,总报酬16是最小值。可见(合作,合作)策略是团体利益最大的策略选择(20>16)。

事实上,一些图书馆为了自身的利益,往往从个人理性角度出发,最终与团体利益冲突,陷入“囚徒困境”。类似于囚徒甲、乙的决策过程,A馆会根据B馆的决策选择策略,当B选择合作策略时,A若选择合作可得10,A若选择不合作,既省去了共享资源需付出的成本,又无偿享受了B馆提供的信息资源,报酬是12。因此,A必然不会合作(显然12>10)。同理可推得,B做出了不合作的选择时,A仍然会选择不合作策略(因为8>6)。显而易见,无论B做出合作或者不合作的选择,A都会采取不合作策略。同样的分析结果对B馆也是适用的,最后的博弈结果为(不合作,不合作),这时总报酬16,小于最优策略的总报酬20。

这一博弈矩阵可以看出,大家最初都希望达到(合作,合作)总报酬为20的结果,但是通过报酬矩阵分析可见,即便已经签订合作协议,各自馆也会抱有“搭便车”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自违背共享约定,形成了图书馆资源共享博弈的(不合作,不合作)结果。

上述两种博弈均为一次性博弈,参与博弈者都只能进行一次选择决定,另外博弈参加者在做出自己决定的时候并不清楚对方的决定,大家都是同时决定自己的一次性策略选择。处在这样的前提之下,参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程,并得出了最终结论,这种博弈称为静态博弈。在静态博弈中,出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面,在达成合作协议以后,参与者都会有投机的心理,并从自身利益出发暗地选择了不合作的做法。另一方面,对于一次性的博弈,只要参与者做出了最终决定便完成了博弈过程,对于违反约定的行为没有补救和惩罚的有效措施,无法通过后续的博弈进行调整和制约。

2.2数字信息资源共享的动态博弈

实际上,博弈通常为一系列重复进行的运动,即相对静态博弈而言的动态博弈,在连续进行的动态博弈中,上面结果会有所不同。

2.2.1数字信息资源共享的无限次重复博弈

无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中,不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动,在以后的博弈中便会遭到其他馆“不合作”的报复策略,而且这一不合作策略会在未来的所有博弈中重复下去,长此以往,首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中,存在着对欺骗和违约行为报复的机会,因此参与合作的各方会担心采取不合作策略给自己带来的长期损失,不会主动选择不合作的策略,使得数字信息资源共享合作得以维持。

继续用图2加以说明,对于图书馆A,各馆如果一直处于合作的状态,便可以长期获得报酬10,累积起来10+10+10+…,但如果抱有机会主义的想法,打破约定选择了不合作的策略,他的确获得了一次性的利益,得到报酬为12,但在以后的无限次重复博弈中,均会受到对方不合作的报复行动,收益只能为8。为了一次性的好处,使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然,任何一个图书馆在数字信息资源的无限重复博弈中,为防止被报复而丧失长期的经济效益,都会遵守协议,采取合作的策略。

2.2.2数字信息资源共享的有限次重复博弈

在有限次重复博弈中,假设事先约定只合作5次,用逆推法进行分析,各方均知道第5轮博弈是最后一轮博弈,因此这一轮博弈便同静态博弈无异。根据前面的分析,这一轮的违约不可能在以后受到惩罚和损失,那么,每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮,因为大家都可以推算出第5轮不合作的结果,因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮,都可以得到同样的结果。显然,在有限次重复博弈中,图书馆数字信息资源的共建合作是不稳定的,博弈的最终均衡策略为(不合作,不合作)。

3用博弈论的思想解决数字信息资源共享问题

在现实生活中,参与博弈的各方合伙的机会必然是有期限的,信息组织间的合作共享是否根本无法实现呢?显然在现实生活中是存在着长期合作的共同体。事实上,无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮,合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中,如果合作双方不确定哪一轮是最后一轮,参与者会认为日后还要继续打交道、博弈状态会继续维持,这便同无限次重复博弈无异。所以,在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中,合作解是可以存在的。当然,为了维护合作模型的稳定性,更好的实现团体利益的最大化,必须配合以必要的措施。

3.1建立信任机制

图书馆信息资源共建共享机制的成功建立,取决于成员间的相互信任和对于联盟内部规则的遵守程度,能够取得收益同时实现持续的发展,其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场,尊重对方的观点,还应加强组织内的交流,达成对某些问题的认识。另外,信任评审机制的建立也十分必要,通过建立完备的综合性、长期性评估测试标准系统,对成员的联盟策略及行动影响因素进行持续地跟踪测评,通过完善细致公平的执行制度,形成稳定可靠的运行机制。

3.2建立监督机制

对于合作中的各馆,都希望采取最优于自己的策略,以期得到最好的结果,因此为了达到合作团体利益的最大化,应该对各成员进行有效监督,维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫,在明确各成员权利义务的基础上,监督各成员的行为。对于损人利己的倾向和行为,及时采取措施,必要时对违反合作协议的成员进行制裁,甚至终止合作。

3.3建立保障机制

因为各图书馆之间的规模与发展水平不均等,建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享,另外数字信息资源共建共享经常发生“搭便车”的问题,这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上,对贡献大的图书馆要采用奖励的办法进行收益补偿,同时针对慵懒的图书馆,通过采取惩罚的方式实现督促作用。

在具体的实施上,以惩罚措施为例,在成员馆签订共享协议时,规定不合作的一方会受到经济制裁,报酬减3,在矩阵图2的基础上可以得到新的报酬矩阵(见图3)。按“囚徒困境”的分析思路,如果A馆选择共享,B馆选择了不共享,B得报酬为9而不是原来的12,因为B馆不共享受到了事后的经济制裁(12-3=9),小于(共享,共享)中的报酬10,可见,B怕受到惩罚得不偿失必然选择共享。对于A的分析也是如此,最后的博弈均衡状态一定是(共享,共享),克服了欺骗或违约行为,达到了信息资源共享的目的。

博弈论方法第8篇

关键词:认知无线电;功率控制;非合作博弈;纳什均衡;效用函数

中图分类号:TN014文献标识码:A文章编号:1672-3198(2009)16-0265-02

0 前言

认知无线电(cognitive radio,CR)是以软件无线电(software radio)技术为基础的能够提高无线通信频谱利用率的新技术。在很多国家,传输效率较高的频段是以授权分配的方式分配给无线通信业务部门和运营企业的,但这些频段的授权用户并不是在任何时刻都使用分配给他的频段,因此不少传输效率很高的授权频段会经常处于空闲状态,这就浪费了宝贵的频谱资源。根据美国联邦通信委员会(FCC)所进行的大量研究表明,在大部分地区,授权频段的平均利用率在15%―85%之间,而一些传输效率较高的非授权频段则过于拥挤。于是Joseph Mitola博士在1999年首先提出了认知无线电概念,目的就是解决频谱资源的有效利用问题。

博弈论(Game Theory)又被称为对策论,是现代数学的一个分支,也是运筹学的一个重要组成部分,是研究互动决策的理论。John Nash博士在1950年提出了纳什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。该理论指出,在一策略组合中,所有的参与者都面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的,此时便达到了纳什均衡。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。这种参与者为了各自利益的最大化不断改变策略的做法,与CR中各认知用户为争得传输效率的最大化对频谱和功率不断进行调整的自适应算法策略相符。因此,可以引入非合作博弈论模型对CR的频谱分配和功率控制算法进行检测和优化。

本文以认知用户的满意度为设计目标,引入代价函数得到一种新的基于非合作认知无线电功率控制的博弈模型,并结合对该模型的分析介绍了非合作博弈论在CR中的一般分析方法。

1 认知无线电体系结构

认知无线电是对软件无线的扩展,因此具备软件无线可重新配置的特点,并且能够实现基于环境认知的自动配置。S•Haykin根据CR所必需的频谱扫描、信号分析、参数测量、频谱决策、协议分析等功能,给出了CR系统构成的基本功能结构,该结构将CR系统分为三个功能模块。

(1)无线频谱分析模块。

该模块通过接收环境中的射频激励,并利用自身算法对激励信号进行动态分析,实时提供对环境中频谱空穴的检测情况,搜集可使用的频谱空穴的信息。

(2)无线信道估计模块。

该模块根据无线频谱分析模块的分析结果,对无线信道状态和容量进行估计,为系统通信信道的选择提供依据。

(3)传输功率控制和动态频谱管理模块。

该模块根据频谱分析模块和信道估计模块的分析结果,选择最优的频谱空穴进行通信。在通信过程中对传输功率进行实时控制,使得首要用户和次要用户均能达到最优的通信水平。

S•Haykin给出的三个功能模块共同构成了CR系统的物理层,从各个模块所具备的功能可以看出认知无线电是应用了多种现代信号处理技术的综合性通信平台。

2 非合作博弈论在认知无线电中的分析方法

认知无线电中的策略选择问题及相关算法的设计是该技术的研究核心。利用非合作博弈论,可以按以下方法及步骤对自适应算法进行分析:

(1)该算法是否能达到纳什均衡。即验证算法是否能达到纳什均衡,具体步骤为:先将所研究的问题抽象为相应的非合作博弈算法模型,然后证明该模型中NE的存在性和唯一性。

(2)该算法达到纳什均衡(NE)后的稳定状态是否符合帕累托最优(Pareto Optimality)。即根据系统的目标函数衡量这一稳定状态是否是实际应用环境中的最优情况。

(3)该算法达到纳什均衡和帕累托最优的约束条件。

3 基于非合作博弈论的认知无线电功率控制模型

在认知无线电中,非授权用户接入处于空闲状态的授权用户频段,可以提高系统的频谱利用率,但是该接入过程必然会导致授权用户和非授权用户之间的干扰。这是由于在CR系统中通常采用动态功率控制以扩大通信系统的工作范围,而每个用户的发射功率都会对其他用户造成干扰。2003年,为了规范移动频段的非授权操作,美国联邦通信委员会(FCC)提出了新的量化和管理干扰的指标――干扰温度。在给定干扰温度和频谱空穴的限制下控制发射功率,可以看做为一组策略问题,而且在实际环境中很好的符合了非合作博弈的模型。在CR中,每个用户都从自身的利益出发,追求功率的最大化,而任何用户发射功率的增大都会对其他用户利益造成影响。因此需要提供一种有效的算法对各个用户的发射功率进行动态控制,以达到所有用户的总利益最大化。

在CR中可以用信道利用率、系统吞吐量、系统信干比等指标来衡量用户的利益。假设以系统信干比来衡量,设计算法时就应当以系统的总干扰水平最小化为设计目标。

通常把授权用户称为主要用户(Primary User),非授权用户称为次要用户(Secondary User)。假设通信环境中多个主要用户和次要用户同时工作,次要用户具有认知能力,即把次要用户看做认知用户。假设认知用户i的发射功率为pi,传输增益为gi,且认知用户与基站存在通信链路,基站接收到的该用户的功率为pigi,第j个主要用户对第i个次要用户的干扰为Qij并有M个主要用户,则相应的次要用户在基站处的信干比(SNIR)为:

ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)

其中σ2为基站处背景噪声,Ri为传输速率,W为第i个用户在的扩频带宽。

文献提出的非合作的认知无线电网络的功率控制纯策略的博弈模型(NPCG)定义了:参与者I={1,2,…,N}为认知网络中非授权用户的集合;策略空间pi,认知用户在一次博弈中选择的策略构成功率矢量P={p1,p2,…,pN};用 表示用户i的效用,即用户i对所选策略的满意程度,其中p-i是除i外其他N-1个用户的功率。

在该模型中,每个认知用户的策略都是尽量增大功率,以获得更高的效用。但当功率超过干扰温度后,整个系统的性能会迅速恶化,进而造成每个用户的效用都会降低。因此,必须选定合适的代价函数,使用户获得更高效用时付出相应的代价。考虑到在低于干扰温度时,用户只需付出较小的代价,而当超过干扰温度时,每增加一定的效用必须让用户付出更高昂的代价,笔者选择SINR的正切函数做为代价函数:

Ci=tg(kri)(2)

其中k为干扰系数,在认知用户发射功率接近干扰温度时,kri的取值接近π2 。

在非合作的认知无线电网络的功率控制纯策略的博弈模型的基础上,结合式(2)笔者提出基于非合作的功率控制算法的数学模型:

ui(pi,p-i)=Ripif(ri)-λpiritgri(3)

其中piri表示增加单位信干比所要增加的功率,λ为惩罚因子,代表代价函数有效性的量度。该模型通过引入代价函数增加了惩罚机制,以此来控制认知用户为追求信干比一味增大发射功率的行为。当功率超过干扰温度后的严厉惩罚,会使所有认知用户意识到,牺牲一定的信干比可以带来效用的最优,从而将发射功率控制在干扰温度以下,避免了超过干扰温度后系统性能迅速下降的恶性情况出现。

按照上节介绍的分析步骤对式(3)给出的模型进行分析,讨论该模型是否存在纳什均衡(NE)以及是否符合帕累托最优。对式(3)求一阶导数后可求得微分方程的驻点,进而再求出二阶导数,易证式(3)的二阶导数小于零。因此可得出该非合作博弈过程中NE的存在性和唯一性,所求得的驻点为唯一的纳什均衡点,同时该驻点即为所应满足的约束条件。

4 结论

认知无线电概念提出的20年以来,随着相关技术的研究不断深入、相关传输标准的确立以及计算机处理能力的提高,CR的应用越来越广泛。本文首先介绍了CR物理层的基本结构,然后结合一种新的基于NPCG的非合作非合作功率控制模型的构建,介绍了非合作博弈论在认知无线电中的分析方法。综上所述,我们有理由相信,随着相关理论和技术的不断进步,非合作博弈论必将在认知无线电的功率分配、频谱分配以及其他核心研究方向发挥更大的作用。

参考文献

[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.

[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.

博弈论方法第9篇

【关键词】博弈论;纳什均衡;重复博弈

博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。因此,本文将主要的博弈均衡概念进行分类和表述, 并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。

一、博弈的主要类型

博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。依据不同的分类标准,博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈

博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表和对弈的简称而来。重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈

完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

3、完美信息和不完美信息博弈

在动态博弈中,一参与人完全了解在自己行为之前的博弈进程,则称此参与人为有完美信息的参与人,如果博弈中所有的参与人都具有完美信息,则称此动态博弈为完美信息的动态博弈。反之,如果在存在具有不完美信息的参与人(参与人不完全了解自己行为之前的博弈进程),则称此动态博弈为不完美信息动态博弈。

4、合作博弈与非合作博弈

合作博弈允许参与人之间自愿签订有约束力的协议,而非合作博弈的参与人则完全按照个人理性做出策略的选择。在囚徒困境博弈中,非合作博弈得到的结果是双方均坦白,而在合作博弈的情况下则可能得到双方均不坦白的更好的结果。

5、完全理性和有限理性博弈

由具备完全理性的参与各方所进行的博弈称为完全理性博弈。存在有限理性博弈方的博弈称为有限理性博弈。

将上述不同的博弈类型进行组合,可以得到更多类型的博弈,如不完全、完全信息博弈和静、动态博弈可以组合为不完全信息静态博弈、不完全信息动态博弈,完美完全信息博弈、完美不完全信息博弈、不完美不完全信息博弈等。

二、博弈论主要的均衡概念

1、上策均衡

如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么该策略组合称为一个上策均衡。

2、纳什均衡

(1)纯策略纳什均衡

在博弈G={S1……Sn;u1……un}中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,……sn*)中,任一博弈方的策略si*,都是对其余博弈方策略组合s-i*的最佳策略,即:

ui(si*, s-i*)≥ui(si, s-i*)对于任一((1~N))都成立,则称(s1*,……sn*)为一个“纯策略纳什均衡” 。

(2)混合策略纳什均衡

混合策略:在博弈G={S1……Sn;u1……un}中,博弈方i的策略空间为Si=(si1……sik),则博弈方i以概率分布(pi1……pik)在其策略空间中进行选择,由此形成的策略称为“混合策略”。其中0≤ pij≤1,且。

将纯策略拓展到混合策略,相应的纳什均衡称为混合策略纳什均衡。事实上,纯策略纳什均衡是混合策略纳什均衡的一个特例。根据纳什定理我们知道,每一个有限博弈(参与人和策略空间均为有限)均存在至少一个混合策略的纳什均衡。

3、防共谋均衡

如果一个博弈的某个策略组合满足以下要求:1、没有任何单个博弈方的偏离了会改变博弈的结果;2、给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;3、以此类推,直到所有博弈方的串通都不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”。

4、子博弈完美纳什均衡

如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足:在整个动态博弈及它所有子博弈中都构成纳什均衡,那么这个策略组合成为该动态博弈的一个“子博弈完美纳什均衡”。

5、颤抖手均衡

如果有限策略博弈的一个纳什均衡满足对每个博弈方i都存在一严格混合策略序列{},使得(1),(2)对于任意正整数m,都是纳什均衡 ,那么,称为一个“颤抖手均衡”。这里的严格混合策略指的是每一个策略都有一个正的被选取的概率。

6、完美贝叶斯均衡

当博弈的一个策略组合及其相应的判断满足以下要求时,称为一个“完美贝叶斯均衡”:

(1)在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的判断,对非单节点信息集,一个判断就是博弈达到该信息集中各个节点的概率分布 ,对单节点而言,则可理解为判断达到该节点的概率为1。

(2)给定各博弈方的“判断”,他们的策略必须是“序列理性”的。所谓序列理性是指在各个信息集,给定轮到选择博弈方的判断和其他博弈方的后续策略,该博弈方的选择及其后续策略必须使自己的期望收益最大化。

(3)在均衡路径上的信息集初,判断由贝叶斯法则和各博弈方的均衡策略决定。

(4)在不处于均衡路径上的信息集处,判断由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。

7、贝叶斯纳什均衡

在静态贝叶斯博弈中G={A1,…,An;T1,…,Tn;p1, …,pn;u1, …un}中,如果对任意博弈方i和他的每一种可能的类型,Si*(ti)所选择的行动ai都能满足:

max

则称策略组合S*=(S1*,…,Sn*)为G的一个贝叶斯均衡。

8、分离均衡和混合均衡

在不完美信息博弈中,在不同情况下(如拥有商品的类型不同)的完美信息博弈方采取相同行为的市场均衡,称为混合均衡(pooling equilibrium);反之,在不同情况下,完美信息博弈方采取完全不同行为的市场均衡称为分离均衡(seperating equilibrium)。

三、不同均衡概念的比较

上策均衡一般适用于静态博弈,虽然具有很好的稳定性,但是在对博弈进行分析的局限性较强,因为在很多博弈中,并不是所有的参与人都具有上策。在博弈论的各种均衡概念中,纳什均衡处于核心的位置。这是因为:1、纳什均衡是分析博弈的有力工具,可以对大量的博弈结果做出有效地判断,不论是静态还是动态博弈,比如运用纳什均衡可以预测古诺寡头市场上各个厂商的产量,也可以用纳什均衡预测动态的斯塔博格模型中的垄断厂商的产量;2、纳什定理表明了纳什均衡的普遍存在性,这说明了在博弈环境下纳什均衡概念本质上的合理性;3、其他的均衡概念基本上都是由纳什均衡衍生而来,如子博弈完美纳什均衡是将纳什均衡扩展到了每个子博弈上面 ,贝叶斯纳什均衡则是将纳什均衡延伸到了不完全信息博弈当中。纳什均衡的主要问题首先,一个博弈往往存在多个纳什均衡,而运用纳什均衡概念本身无法再对这些均衡进一步分析;其次纳什均衡不能排除博弈策略中所包含的不可信的行为设定,不能解决动态博弈的相机抉择所引起的可信性问题,这导致了纳什均衡的内在不稳定性。

利用逆推归纳法,子博弈完美均衡有效地排除了纳什均衡中不可信的行为设定,从而提高了纳什均衡的稳定性 ,但是逆推归纳法也有严重的弱点。首先,逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则、和收益情况都非常清楚,并且各个博弈方了解博弈结构,并相互指导对方了解博弈结构,而现实问题往往与这些要求相去甚远;其次对于阶段比较多,比较复杂的动态博弈,比如对弈,运用逆向归纳法的工作量则变得极为庞大,以至于借助计算机也无法完成;如果遇到两条收益相同的路径,逆推归纳法则无法继续进行下去。逆推归纳法更大的问题是对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许博弈方犯任何错误 ,而且要求所有博弈方了解和信任对方的理性,形成“理性的共同知识”,这些条件在现实中同样难以得到满足。

颤抖手均衡的概念在一定程度上解决了子博弈完美均衡和逆推归纳法所遇到的问题。颤抖手均衡考虑到参与人难免会犯一些错误而舍去了由于参与人小概率的偏移而导致整个策略组合不可行的均衡路径,因而具有更高的稳定性 。但是颤抖手均衡本身并没有解决博弈方犯错误的问题,因而也不能保证它的预测就是实际博弈的结果。

贝叶斯纳什均衡和完美贝叶斯均衡是针对不完全和不完美信息博弈问题提出的。造成不完全和不完美信息博弈问题的根本原因是参与各方的信息不对称,而这在现实的经济活动中是普遍存在的,如在保险市场、信贷市场、劳动力市场、柠檬市场、拍卖市场上的情形。分析和解决信息不对称问题对经济活动造成的影响是现代信息经济学的核心问题,因而博弈论成为信息经济学研究的有力工具,现代信息经济学取得的迅猛发展和博弈论广泛运用分不开的。完美贝叶斯均衡是针对不完美信息博弈提出的均衡概念,而贝叶斯纳什均衡是针对不完全信息博弈提出的均衡概念。海萨尼通过引入一个虚拟的自然博弈方将原来的不完全信息博弈问题转换为完全但不完美信息博弈问题,使得动态贝叶斯博弈分析就可以利用完美贝叶斯均衡、分离均衡、混合均衡等概念和方法进行分析。

四、结束语

本文对博弈论中主要的均衡概念进行了描述和比较分析。上策均衡是最直观的博弈均衡概念,但适用范围非常有限。纳什均衡是博弈论的理论基石,从本质上刻画了处于博弈环境(即每个参与人的收益受到整个博弈策略组合的影响)的均衡状态。子博弈完美均衡解决了纳什均衡中不可置信威胁的问题,颤抖手均衡将博弈方犯错误的可能性考虑了进来;而贝叶斯纳什均衡和完美贝叶斯均衡则可以用来处理信息不完美和不完全问题。当然,本文所涉及的博弈均衡概念基本上都是关于非合作和完全理性下博弈(颤抖手均衡虽然考虑了博弈方可能会犯错误的可能性,但这并不意味这博弈方的有限理性)。关于合作博弈和有限理性博弈也发展出了一些均衡概念,如纳什谈判解、夏普利值、进化稳定策略等,另外关于非合作博弈也有一些均衡概念本文没有涉及。随着博弈论理论的不断发展和实际运用的日趋广泛,博弈均衡的概念将会得到不断地精炼和更新。

参考文献:

[1]谢识予,经济博弈论(第三版)[M],复旦大学出版社,2006。

[2]朱.弗登伯格,让.梯若尔,博弈论[M],中国人民大学出版社,2002。