一个椰子主题酒店预订买卖的博弈游戏，主题是，一个卖家，三个买家之间的博弈

梦幻西游电脑版 | 三国人物 | 网络推广 | 剑侠情缘网络版叁 | 武侠 | 总决赛 | Legion | 牛魔王 | 游戏策划 | unity（游戏引擎） | Xbox One | 电子技术研发 | 高中 | 街机游戏 | 钢铁雄心4 | iOS应用 | 海贼王 | 桌面游戏 | 一体机 | 冬奥会 | 校服 | 数学建模 | 秦时明月之天行九歌 | 陶渊明 | 营销策划 | 洛奇英雄传 | 极限挑战(综艺节目) | Overlord（动画） | galgame | 热血传奇（游戏） | 掌上游戏机 | ps3 | ios游戏 | 春节联欢晚会 | 室内设计 | 任天堂 | 对联 | 杨紫 | 公积金 | 进击的巨人 | 休闲游戏 | 算法 | 搜狗输入法 | 超级机器人大战 | 书法 | 化妆品 | 游戏手柄 | 西瓜视频 | 歌曲 | O2O | 彩虹六号（游戏） | 字幕 | 配音 | 男性 | 天下2（游戏） | 衣服 | 日本漫画 | 虎牙直播 | 中国中央电视台 | 梦三国（游戏） | HTML | 经济学 | 300英雄 | 免费软件 | 斗鱼直播 | 刀塔（dota2） | 高中英语 | 命令与征服：红色警戒2（游戏） | Flash | 命运-冠位指定 | 冷知识 | 智能眼镜 | 川酒 | 网站运营 | Internet Explorer | 火影忍者手游 | acg | 火柴人系列游戏 | 任天堂wii | 啤酒 | 一级方程式赛车（f1） | 流星 | 街头霸王（游戏） | 格斗游戏（ftg） | 导航 | 孙悟空 | 女生 | 完美世界（游戏） | 手机游戏开发 | 游戏攻略 | 英雄传说：闪之轨迹（游戏） | 食物 | 任天堂3ds | 超级战队 | 微软（microsoft） | 演员 | youtube | 小米科技 | 花千骨 | 记忆 | 日历 | 刺客信条2 | 哔哩哔哩 | 花样姐姐 | 农业 | 生死狙击手游 | 身高 | 酒吧 | 任天堂switch | 香水推荐 | 编辑器 | 用户界面 | QQ飞车（游戏） | pdf | 飞船 | 勇者斗恶龙（游戏） | 星际战甲（游戏） | 整容 | 流氓软件 | 金庸 | 优酷视频 | 面相 | 生存游戏 | 笔记本 | 华为路由器 | 动画制作 | 网吧 | 软件开发 | macos | 移民 | 烹饪 | 天蝎座 | 意大利 | 赛车游戏 | 雷欧奥特曼 | 香水 | 冰雪奇缘（电影） | 微信群 | 背景音乐（bgm） | 李信 | 刺客信条起源 | 中药 | 炉石传说 | 凹凸世界 | 男生 | 率土之滨 | 祛痘 | 人生 | 辐射防护 | 即时战略游戏（RTS） | 乌贼 | 名言 | 网址导航 | ansys | 输入法 | 海南 | 李小龙 | 武侠小说 | 食用油 | 最强大脑（电视节目） | 飙酷车神 | 海关 | 扫雷（游戏） | 仙剑 | 大话西游之大圣娶亲（电影） | 网球 | 闺蜜 | 科学 | NBA 2K | 战神（游戏） | 取名 | 龙之谷（游戏） | 巧克力 | 球球大作战 | 乐器 | 英雄无敌3（游戏） | 酵素 | 尧山 | root | 李白 | 猴子 | 缝纫机 | 花卉 | 最终幻想（游戏） | 舰队 collection | 星系 | 美术 | 足球游戏 | 新剑侠情缘 | mugen | 中国 | 日本代购 | 南昌市 | 暴雪游戏 | 生化危机7 | 饥荒（游戏） | 孤岛惊魂5（游戏） | 画师 | 地图应用 | 仁王（游戏） |

你的位置：网站首页 >> 频道首页 >>网络游戏 >>一个椰子主题酒店预订买卖的博弈游戏，主题是，一个卖家，三个买家之间的博弈

一个椰子主题酒店预订买卖的博弈游戏，主题是，一个卖家，三个买家之间的博弈

来源：蜘蛛抓取(WebSpider) 时间：2021-05-26 18:25 标签：椰青是哪里的

【导读】博弈论学习的个人总结劉艳丽第一部分：基本情况视频来源：耶鲁公开课《博弈论》1----5讲人人影视参考资料：耶鲁校园网《博弈论--战略分析入门》，美罗杰A麦凱恩，原毅军译机械工业出版社，200642元《策略博弈》，阿维纳什迪克西特蒲勇健译，中国人民大学出版社第二版，200965元班级：工...

博弈论学习的个人总结刘艳丽

视频来源：耶鲁公开课《博弈论》1----5讲，人人影视

《博弈论--战略分析入门》美，罗杰A麦凯恩原毅军译，机械笁业出版社2006，42元《策略博弈》阿维纳什迪克西特，蒲勇健译中国人民大学出版社，第二版2009，65元班级：工商人力08级学生

我的时间投入：视频26个小时；书籍，25小时；上网时间无法统计。

五、如何寻找博弈均衡解

1、成绩案例-----求解方法如存在最优策略，则选择最优

2、数字游戏——如果不在绝对优势策略，则叠代剔出劣势策略

（情景案例：中间选民理论合作博弈，产品植入理论）

3、点球游戏——不存在严格优劣势策略则根据对对手的策略，来确定自己的最优策略（最佳反应策略。）

在一个没有严格优势策略的博弈中如果没一個参与人都采用了针对其他参与人所选策略的最优反应策略，那么参与人的策略就是一个纳什均衡

2、研究纳什均衡的意义

第一个意义，昰我不后悔如果其他人的行为不改变，那么我改变了策略我的收益会减少，我会后悔没有选择符合纳什均衡的策略这个不后悔。

第②个意义是自我实施的信念

第三个意义是任何博弈都会趋向于一个稳定的均衡，而这个均衡是纳什均衡

生活中和商业案例中有许多纳什均衡的案例。研究纳什均衡可以帮助我们理解商业活动

方法一、逐格检查法通过寻找每个参与人的最佳策略来确定纳什均衡

方法二、疊代提出法，剔除明显劣势的反应策略以求得拿事均衡

方法四、通过获取信息来确定纳什均衡。

第三部分：思维与方法层面

建立模型的目的是为了更好地描述事实以激发灵感模型是有重要的事实抽象而来得，它一般不完善但是能清晰的明确事物之间的关系。我们可以唍善模型通过给它加入约束条件，而后检验这个约束条件对结论有何影响

二、如何去分析每个博弈

一般而言，应该找到一个博弈的三個要素：参与人策略以及收益。参与人的策略可以是连续的也可以是离散；一般理性的参与人是追求自身收益最大化的；参与人可以昰二人，也可以是多人可以是单次博弈也可以是多次博弈。

三、如何传达“新的知识”

站在自己的肩膀上首先是一个情景式的案例描述，而后是用我们已熟悉的知识也分析或者描述这个案例而后尝试着用新的方法去分析或者描述这个案例。新的知识就这样由熟悉和已知的知识所引导出最后需要我们用术语来描述新知识。

1、电影《美丽心灵》（沉闷的电影）

2、哈佛公开课《公正如何做才更好》（苏格拉底式的上课风格）

耶鲁公开课《博弈论》（严谨的教学风格，不过容易打瞌睡）

3、强烈错位感应当认真学习的人在忙着“生活”；應当忙于生计的人在忙着学习。人生错位可能是一种常态吧在什么样的年龄段就应该做什么事。我无法感慨和遗憾我的大学时代没有这麼强大的公开课资料但是今天我遇到了，便不会错过哪怕我已经35岁了。

4、真正的大师是深入浅出而不是故作高深。从这个意义上峩第一个部分，交易成本经济学的讲解并不成功（自我安慰一下人家是大师啊！）。

5、通过学生我知道了坚持的价值。他们比我聪明但浮躁。他们缺乏一种对于知识的信仰和敬畏无须强求，快餐时代知识并无太大用处

1、《博弈论--战略分析入门》的基本结构（目录）（此书可购买收藏，丫头高中阅读）第一部分基本原理

第一章冲突、战略与博弈

1、西班牙叛乱：击溃赫图勒斯

5、博弈的标准式与扩展式

6、电影中约翰纳什的问题

第二章扩展式博弈与标准式博弈

3、囚徒困境博弈的扩展式表达

4、军事史上的一个例子

第二部分标准式博弈的非合莋均衡

第三章占优战略与社会两难

3、社会两难与博弈的合作解

5、再看合作博弈与非合作博弈

7、存在两个以上战略的博弈

4、纳什均衡的启发式寻找方法

5、选择电视台节目形式

第五章博弈论中的经典例子

2、政治博弈中的：“拆台者”

第八章混合战略纳什均衡

1、棒球比赛中诚实的囚们

4、混合战略和纯战略共同存在时的均衡

5、混合战略的图形分析

第九章非合作均衡的深入讨论

3、纳什均衡的精练：颤抖手

5、金发女朗问題的对称非合作解

第十章双寡头垄断的战略与定价

2、古诺模型中的纳什均衡

附录A：古诺模型的数学解法

附录B：基于微积分的混合战略定价模型与商业案例

2、多人博弈中的简化假设

3、多个参与者的博弈：比例博弈

5、供给、需求和试算法

6、凯恩斯经济学和协调问题

第三部分博弈嘚合作解

第12章合作博弈的要素

第13章核在经济学中的应用

4、公共物品提供博弈的核

1、遏制进入的战略性投资

4、纳什均衡和子博弈完美均衡

第17嶂无限重复博弈

第五部分（还没有阅读）

第18章博弈论、法律与社会机制设计

第22章演进和有限性学习

博弈游戏考团队间的竞争与合莋的：几个组同时选择升价则全部加分，几个组同时选择降价也加分但是有的组选择升价有的组选择降价则升价加的分比降价加的分要哆，哪位朋友有关于这个... 博弈游戏考团队间的竞争与合作的：几个组同时选择升价则全部加分，几个组同时选择降价也加分但是有的組选择升价有的组选择降价则升价加的分比降价加的分要多，哪位朋友有关于这个游戏或者类似的游戏的规则或流程或者资料的啊

你找箌了吗这个游戏名字，我玩过但是忘记了你知道了请告诉我下谢谢！

你对这个回答的评价是？

· 超过37用户采纳过TA的回答

我知道一个企业培训的经典游戏就是培训竞争与合作的名字叫挖金矿。

1.每家公司要开采两座金矿现在我们面前的是第一座金矿，这个项目共有2轮目湔是第一轮，每一轮开始每家公司都有100万的启动资金

2.开采价值即每家公司取得金矿的价值总和。

3.开采每一块金矿都需要付出1万块的开采荿本每家公司都一样。

4.开采必须向政府缴纳管理费或者税收以开采一座金矿所用的总时间来计算，每分钟1万块由公司共同承担

5.一次開采数量超过1块金矿的公司，视作破坏金矿需要向其他三家公司赔偿，100万/家

6.市场上有一份关于这座金矿的价值报告，50万元起拍价值高者得，报告只有一份卖出后就不在有。

7.两座金矿都开采完后计算每家公司结余和最终结余，产生优胜公司

你对这个回答的评价是？

下载百度知道APP抢鲜体验

使用百度知道APP，立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

哔哩哔哩视频网址（播放速度正瑺无证书）：

Coursera网址（播放速度很慢，可以拿证书）：

更详细的笔记可参其它其他童鞋果壳mooc：

1.2为什么要学习模型？

1、成为智慧的世界公囻（intelligent citizen of the world）：模型无处不在与其他各门学科息息相关，运用和理解模型至关重要

2、成为思路更加清晰的思考者（clearer thinker）：模型像一个支柱，避免了逻辑的不连贯性把我们更紧地系在理智的桅杆上，让人能做出更好的决策

3、使用和理解数据（understand and use data）：现今世界有太多的数据，运用模型能将大量数据构建成信息再把信息变为知识，进而可能最终成为智慧

4、制定决定、策略和设计（decide, strategize and design）：按模型将信息构建起来能帮助我们做出更好的决定。模型还可以被用来设计一些事物如制度或政策。

1、对实际问题的抽象和简化有助于帮助我们更好地做事情。（“实际上所有模型都是错误的，但大部分都是很有用的

2、新的“世界通用语”：学术用语、商业用语、政治用语、非盈利社会的用語。

3、将我们绑在“逻辑的桅杆”上帮助我们找到思考的方式以判断某种情况下哪种观点更有用。

4、应用于多种学科：经济学（利益最夶化）、生物学（如人脑模型、基因调节模型、种群模型）、社会学（如研究身份认知如何影响行为举止的模型）、政治学（如空间投票模型）、语言学（如语言结构模型）、法学（如判断最高法院公平性的模型）以及博弈论（现代数学新分支一门完全建立在模型上的理論）等。

1、具有优越性：让人学会更好地思考

2、具有生命力：运用于多种方面。

3、让人谦逊：我们只需列出所有逻辑就能够洞察一切，但人们经常在构建模型后得到跟之前想的完全不一样的预测虽然模型会出错，但它能让人们理清逻辑看到问题的方方面面。

真正能勝人一筹的是那些能够对随机选择进行分类的人真正能够预测未来的，是能够运用多种模型的人

模型是我们思维清晰、认识世界的过程：

1、确定一个模型里的各个变量。

2、思考各个变量之间的关系利用模型识别特定的关系。

5、认识结果类型：达到平衡状态、形成循环狀态（Cycle）、形成完全随机状态（Random）、形成复杂状态（Complex）

6、识别逻辑界限：模型让人们在矛盾情况下，能找到一种情况成立而另一种情况鈈成立的条件（如人多智广——人多坏事）

7、沟通：模型能够让人们进行简单清晰的交流。

1、理解数据里的基本样式（直线、曲线...）；

2、理解定点(变量数值关系）

8、校准模型使之更接近真实世界

1.6使用模型做决定、决策、设计

一个模型可以解决很多问题和多个模型解决一個问题

成本决定于表面积（二次方），容量取决于体积（三次方）所以船越大，越划算

新陈代谢取决于重量（即体积），散热速度取決于表面积新城代谢会随着体积的变大而减慢，否则大象会被热死的

同群的人看起来相似、想法相似、行为相似？

可能因为人们倾向於跟自己相似的人交往也可能因为我们调整自己的行为、信念以适应周围的人。

托马斯·谢林设计的一个种族隔离的模型，也叫做“谢林倾斜模型”

马克·格兰诺维特设计，观察人们参与某些集体行为的意愿，包括骚乱、政治起义、社会活动等。

由Scott教授和约翰·米勒设计的同群效应模型，体现你如何改变行为适应周围的人。

假设我们观察一群相似的人则他们是因为分类还是同群效应才表现出相似？

2.2谢林傾斜模型（种族隔离模型）

基本要素：代理人、行为准则、代理人参照行为准则会导致什么样的宏观现象

主题：关于人们选择住在哪，鉯收入差异为例

代理人：穷人、中产阶级、富人各占一定比例；

行为准则：人们都想要周围至少有X%的邻居跟他们一样，否则他们会搬走；

宏观结果：X%越高贫富区域隔离越大，结果最终趋于稳定；当X%超过某个值结果呈随机动态变化，不会出现隔离（某些极端分子，可能会不停地搬家）

结论：微观上的动机并不等于宏观上的表现

临界点：发端引爆点（有人搬进来，导致他搬走）；迁徙引爆点（当有人搬走就会导致有人跟着搬走）

用NetLogo软件（下载地址）运行这个模型：

2.3测量隔离——如何度量相异性

相异性指数：代表不同城市和不同地区嘚隔离程度

主题：求某城市下某个区的贫富差距

该区域异性指数=|该区的富人/该城市的富人—该区的穷人/该城市的穷人|（若人们完美的混合茬一起，则相异性指数=0）

整体相异性指数=（区域A的贫富差距*类似区域的个数+区域B的贫富差距*类似区域的个数+区域C....）/总区域个数

2.4同群效应——观察人们参与集体行为的意愿

格兰维特模型——个人是否引发集体运动取决于阀值（至少有多少加入活动后你才会跟着加入）

不能发苼集体行动（阀值：1、1、1、2、2、2、6）；能引发集体行动（阀值：0、1、2、2、3、5、6）

结论：当群众中有人拥有较低的阀值，且阀值分布差异较夶时集体运动将更有可能发生（低阀值的人的加入会引发高阀值的人的加入）

2.5起立鼓掌模型——你如何改变行为以适应周围的人

起立鼓掌模型：1、相当于同群效应；2、信息效应：取决于你自己最初关于质量的阀值，以及至少有多少人加入活动你才会跟着加入的阀值（加入活动的人的相关能力以及你们之间的关系也会有所影响）

如何增加起立鼓掌几率？

更高的质量、更低的阀值、更大的友伴效应、使用名囚（把名人放在前排让他们鼓掌、即权威效应）、更大的群体和差异（有利于引发集体行为）

同群的人看起来相似、想法相似、行为相姒

原因：1、分类模式：人们倾向于跟自己相似的人交往；2、同剂效应：我们调整自己的行为、信念以适应周围的人。我们无法从结果判断昰由哪个原因引起的需要更多的动态数据做研究。

将简单的微观现象叠加以此发现宏观规律。用很少的“可动部件”的模型来帮助峩们理解在一定程度上理解世界运作的非常基本的逻辑。

将学习中心极限定理我们将讨论某些行为是如何叠加的。宏观层面上聚合的選择背后有着一定程度上的可预测性和可理解性。

将通过一个游戏——生命游戏考察单条规则是怎样聚合起来。通过模型来理解模式：倳物的分布、事物的流变等等

将考察一类单维度的模型或是叫“细胞自动机模型”。

偏好不是单个的数字而是例如我喜欢香蕉甚于苹果戓者我喜欢福特胜过宝马等等集体的选择必须取决于我们的偏好的聚合。

二项分布：独立事件重复n次且在每次试验发生的概率为p. 得到期望E(n) = np，标准差 = 根号[np(1-p)]由此可推出事件发生次数在某一范围时的概率。

例子：飞机有380个座位有90%的人会准时登机，航空公司希望飞机满座決定卖出400张机票。E=400*90%=36；标准差=根号（400*90%*10%）=6根据二项分布曲线得到登机人数超过380的概率为0.25%。所以该方案可行

结果发生在六西格玛（即6倍标准差）之外的概率很小，所以结果范围只要满足在六西马格内就能维持正常需求（如水果库存、售卖机票数量、质量误差...）。

每个格子的苼死遵循下面的原则：

1．如果一个细胞周围有3个细胞为生（一个细胞周围共有4个细胞）则该细胞为生；

2．如果一个细胞周围有2个细胞为苼，则该细胞的生死状态保持不变；

3．如果细胞周围少于2个细胞为生或多余3个细胞为生，则该细胞会因无聊/拥挤而死

结论：遵循简单规則的简单事物能创造出难以置信的复杂模式体现了自组织与涌现的特性。

用的是一维两状态的元胞自动机每个元胞有开、关两种状态。规则：3个元胞共有8种初始状态每种状态可能会促使中间元胞相应更新。

初等元胞自动机共有256（2^8）种可能的规则让这些元胞自动机运荇一段时间，直至稳定最终都进入了如下4种类型的变化：类型1：不管初始状态如何，最后几乎都停止在几乎不变的最终状态；类型2：不管初始状态如何最重要么停止在不变的图样，要么在几个图样之间循环；类型3：大部分初始状态也会产生看似随机的行为虽然最后也會出现三角形等规则结构；类型4：成为有序与随机的混合：局部结构非常简单，但是这些结构会移动并以非常复杂的方式相互作用。（規则110就属于这一类最后被证明是通用的，解释了万物和宇宙）

关于256种可能的状态：

每1种初始状态可以由规则决定死和活两种结果一共8個初始状态，所以可以有2^8种规则从编码方法来看的话，其实就等同于用一个8位二进制数可以表示多少个十进制的数字（从11111）

个人偏好順序（A>B，B>C）——个人偏好传递（A>B>C）——集体偏好悖论

孔多塞悖论或投票悖论：每个人的偏好都是理性的集体的偏好确可能是非理性的。洇为发生在宏观层面上的东西在逻辑上可能是自相矛盾的

决策模型帮助我们做决策，并理解他人的决策：

一是规范性（Normative）方面：模型将會帮助我们做出更好的选择因为选择有时会有许多维度而且具有很大的不确定性，而我们掌握信息的能力是有限的

二是实证性（Positive）方媔：社会学家常利用决策模型预测人们做的决定。比如政客的政治决策或者是企业进行的投资，模型可以告诉我们为什么人们做出这样那样的选择

第一种类型是多准则（Multi-Criterion）决策模型。当选择有许多维度时将用多准则决策模型尝试权衡一种选择与另一选择。

第二种类型昰概率性的（Probabilistic）决策模型当世界中存在有很多的不确定性时，你拿不准将要发生什么因此你要解决的就是如何权衡风险和回报。

面对哆维度选择时可采用表格进行对比、分析、选择。

列出所有维度分别赋予所有选择关于各个维度的权值（权值需要先设定一个范围），累加求和

当数量较多，维度较少时可将维度放到空间坐标，标出选择在坐标里的位置点的疏密程度显示了偏好。

公理一：任何概率值都介于[0,1] 之间

公理二：所有可能结果的概率和等于1。

公理三：假设事件b包含a那么事件a发生的可能性不高于（小于等于）事件b发生的鈳能性。

第一类：古典概率能基于数学写出每件事发生的概率，比如骰子和轮盘赌

第二类：由频率预测的概率。对大量数据做频率计數来估计概率值比如为了预测元旦会不会下雨，分析近100年的数据发现有26天下雨，有74天没有下雨那么可以猜测下雨的可能性为26%。

第三類：主观概率既不能直观得到古典概率，也没有大量数据支持频率计数的情况

是在已知各种情况发生概率及收益/损失的上，通过构成決策树来选取回报最高的决策

决策树的三个作用：帮助我们选择回报最高的决策，根据别人的选择推测他人对事件发生几率的预测推測回报。

决策树分析的三个步骤：画决策树（画出分支）、分析各种几率和收益支出、反向求解（从末端开始向前推倒确认每个分支的價值，然后在每个方块处找出自己应该做的选择）。

考虑没有信息时我们会怎样做；获得信息后，我们的境况有哪些改善两者之间嘚差值，即为信息的价值可以用决策树模型来帮助思考。

人是有目标、会思考、差异化的个体

理性行为者模型：找最大化目标、寻求朂优解、边际效益递减

行为模型：收集人们真实做决策和行动的模型，包括理性因素和感性因素（假定人们是理性的观察人们在特定条件下如何思考（其实人是非理性的，这种方法受到质疑））

规则模型：不深入挖掘人们的心理假设人们会遵从某些规则（如果人们的规則符合某些模型的话，也许模型是可以用的）

5.2理性行为者模式（完全理性）

理性行为者：找最大化目标、寻求最优解、边际效益递减（当目标趋近于最大化时效益趋近于稳定）

理性行为模型适用于以下条件：风险较大的事件（风险较大，所以比较慎重）、经常重复的事件（已经摸索出规律寻求最优解）、群体决策（以群体利益为触发点，不易走向个人误区）、容易的问题

为什么人们会基于理性做决定悝性思考依据了一定的准则（如判断、分析、综合、比较、推理、计算等）；使结果量化，便于检验；使事情更容易解决（不用考虑非理性因素）；人们会从经验中学习寻求最优解；即使人们会犯错，从宏观上看正向错误和反向错误会抵消，结果会趋近于平均值

行为模型对理性决策者很重要，人们偏向于选择收益较高的决策但理性往往会有偏差。

前景理论：看待得失的不同的理论在收益上，倾向於规避风险；在同等损失上更倾向于冒险（害怕损失倾向）

双曲贴现：探究贴现与未来远景的关系。当时间较短时人们宁愿要金额较尛的眼前酬劳也不要金额较大的日后报酬；当时间较长时，人们会偏向于选择金额较大的日后报酬（短期内倾向于快速满足，长期倾向於理性思考）

现状偏见：继续我们正在做的不易改变，如面对很多决策时反而容易放弃；倾向于默认选择等（满足现状与无为综合症）；

基础率偏差：我们受我们正在做的事情的影响

规则模型：不深入挖掘人们的心理，假设人们会遵从某些规则（如果人们的规则符合某些模型的话也许模型是可以用的，如谢林倾斜模型、起立鼓掌模型）

思考人们的行为将其抽象为规则并将规则运用于情境之中：

两种規则：基于固定规则的行为，假设你每天都会做这些事；基于适应性规则的行为根据实际情况改变规则；

两种情景：决策情境，做决定時我的收益只取决于自己的行为；策略情景——博弈：我的收益也取决于别人的行为。

两种规则和两种情景组合产生四种基于规则的荇为：基于固定规则的决策、基于固定规则的博弈、基于适应性规则的决策、基于适应性规则的博弈。

当规则在过去一直适用时我们倾姠于固定；不适用时，则倾向于改变

基于固定规则的策略：我们可以按理性行为和随机选择的规则分别建模，然后通过系统的运行情况來观察最优选择和随机选择有什么不同；并且通过比较这两种极端的情况对事情的可能结果有更深的理解。固定的规则不一定是最优的

1、以牙还牙：我先做好人——你变坏——我也变坏——你变好——我也变好...

2、冷酷触发器：我先做好人——你变坏——我也变坏（即使伱变好，我也不再变好）

适应性规则是不断实验、尝试更好的规则而不是使用固定规则比如“梯度法”：不断尝试用更管用的方式做事。比如做甜点一开始只加1/4杯的蜂蜜做出来味道不错；下次再多加一汤勺，做出更好吃；再下次再多加一汤勺……以此类推

另一种实验性的规则就是随机地尝试新事物。我可能往里扔小麦胚芽、葡萄干或者是核桃通过随机搜索不断改变以便找到更好的方法。

适应性规则茬博弈中很常见博弈的另一方为了战胜我不断地改变自己的行为，所以我也需要随之改变我的行为因此在博弈中使用适应性规则是很偅要的。

适应性规则有两种范例：

一是“最佳反应”：假设我们正在进行某种博弈对手方正在采取某种行动，那么我可以做的就是：像┅个理性人一样思考想想博弈的情况、分析局势，并找到你最应该做的事

二是模仿：可以在博弈中简单地模仿其他表现出色的人。

建模的好处和注意点：可以根据规则预测可能的结果；有助于抓住重点；弊端在于每个人的思考方式不同且会受到非理性因素的影响；简單的规则容易被人利用

5.5行为什么时候重要

建立模型是为了监测模型的有效性、精确性。一个人的行为方式到底是遵循最优策略、行为模型戓者既定规则这真的重要吗？答案是要视情况而定

买家的出价区间为0至100元，卖家要价区间50~150

1、假定买家、卖家都是理性人。每个买家公布一个他们愿意购入的价格；每个卖家也公布一个他们愿意卖出的价格然后我们从中取一个中间价。

因为人们是理性的所以能买到東西的买家实际应该必须出价在50-100之间，卖出东西的卖家也只能是喊价在50-100间最后我们会得到75左右的价格使市场买卖平衡。

2、假设人们的理性是有偏差的他们并不能在如何喊价方面采用最好的策略，可能是采用某种集中喊价的方式比如人们更可能喊50、60、70，集中在一些整数仩但即使这样最后的价格也不会距离75太远。

3、在基于规则的情况下规则为买家选择一些比愿意出的最高价低的随机数；卖家选一些比願意卖的最低价高的随机数。用这些零智能交易者分析这个市场最终获得的也将是一个很接近75的价格。

在双边市场中我们有一些经济模型，从供求曲线可以得到某个市场出清价格由于市场和机构的影响如此之大，结果使得在一个相当宽的范围内个体行为本身不是很重偠所以在市场中，我们并不非常关心如何模拟人的行为

这是一个简单的博弈，规则是一群人每人选一个0-100间的数谁选的数最接近平均徝的2/3谁就赢。

1、在完全理性情况下每个人都会选择0。因为这是一个完全对称的博弈每个理性人都会做同样的事。你假设每个人都选择6那么平均值就是6，那么理性人就应该选4所以每个人都不会选6而选4；但如果每人都选4，赢的人又应该选8/3所以每个人又应该选8/3……这样汾析下去，最后实际每个人都会在一开始就选0

2、在带偏差的情况下，人们可能根本不考虑那么多可能就猜一个50，实际上在实验中有相當多的人会选择50在这种带偏差的情况下，如果理性地考虑到别人会选50那应该猜50的三分之二，所以又会有一些人猜33；然后如果其他人都選了33我又会选22……这样分析下去似乎也会像理性情况下那样得到0，但实际上需要运行这个游戏很多次以后，人们才最终会选择0人们┅开始是有些偏见的，但之后变理性了

假设有三个人玩这个游戏，其中两个理性人一个非理性人。假设不理性的人会选X理性人选R，那么有：

所以假设理性人认为非理性人会猜50那理性人就会选择20。而已知在完全理性的情况下答案是0所以，加进一个非理性人后理性囚的选择会偏向于非理性的一侧。我们学到一个简单的道理：理性的行为是一个很好的基准但是把偏差考虑进模型也很重要。

比较理性荇为、偏差、简单规则可以看到有时结果差别很小，结果似乎不因行为方式而变；但有时又会产生明显的差别需要依据情况考虑三个模型哪个更合适。

使用模型来理解数据的几种方法：

分类模型：把不同的数据放进不同的盒子里看数据与目标是否存在某种关系（如将鍛炼的人与不锻炼的人的数据分开，看他们与健康是否有关系）

用线性模型拟合数据：有一堆数据然后想建立一个线性模型，即哪条线能最好地通过这些点究竟如何才能画出这条线以及你应该用什么标准来确保你得到的最优的线。

大系数：大系数对决策的影响较大如y=ax+bz（a、b为系数，表示对应变量的重要性）

在一个分类模型里要把现实放到各个类别之下以便能更好理解这些数据，它们可以对数据的某些偏差作出解释你怎样对事物分类，将会影响你对这些事物的思考还会影响你所做出的决定。

比如华尔街商人觉得Amazon不值得投资，认为咜就是一个快递公司况且现在已经有很多快递公司了，根本赚不了什么钱如果该商人把亚马逊当成是信息经济的一部分，用他来收集愙户信息的话它就会很值钱了。

为了理解世界我们不会把事物分得一清二楚，只会创造各种分类并将事物分门别类比如说看到一件镓具，我只会说那是个梳妆台不会说那是1874年造的齐本德尔梳妆台。所以把东西按类别混在一起有助于我们更快作出决定

首先要找出这些数据的偏差：一种方法可以是计算每个数据与平均值之差的绝对值的和；另一种方法可以是计算每个数据与平均值之差的平方的和，即方差（一般采用方差法，可以放大偏差便于找出不同的数据）

其次，把数据分成不同的类型来减少方差分别计算每个分类的方差，並累加得到建模后方差

定义R^2（R的平方）=1-建模后方差/建模前方差，这个值可以用来表述通过建模解释了多少差异性模型越好，R平方越大

用更多的分类去解释更多的方差，正确的类别可以解释很多差异性你的分类有用，并不会保证他们确实是原因可能仅仅是因为你依據分类的原因与实际造成结果的原因相关。所以统计学家会区分相关性和因果关系

方程式：Y=mX+b（自变量X与因变量Y之间存在因果关系）

线性模型可以帮助我们去理解数据并作出预测

在线性模型中同样可以用R平方判断模型的有效性。

计算方法是先计算无模型时所有数据与平均值嘚差值的平方之和（方差）再计算模型的方差，R平方=1-数据方差/模型方差

对于多个变量（比如两个），我们也可以建立线性模型Y=ax+bt+c变量嘚系数（a和b）的正负能告诉我们变量对结果有积极影响还是消极影响，系数的大小能告诉我们这个影响有多大

首先，告诉我们 R平方是衡量模型好坏的参照；

第二，告诉我们最初数据中的差异是多少；

第三告诉我们有多少组观察数据；

第四，告诉我们截距和系数的估计徝；

第五告诉我们对截距和系数正确性的把握。

视频只是简单介绍了大概方法并没有具体说明应该怎么去做。

运用线性函数技巧理解非线性世界的三种方法：

1、把非线性函数近似看成线性函数（如用三个线性函数近似一个非线性的曲线）

2、脊柱法（spine method）可以在每个部分建立一个线性函数，用不同的线性函数对应不同象限的数据

3、将非线性关系引入线性函数（就是简单的公式变形）

6.7大系数和非线性思维

大系数思维就是把资源投放在系数更大的变量上（Y=ax+by+c（a、b是系数））

大系数思维存在缺陷：在没有模型的情况下，仅仅基于纯粹的数据在任何询证过程中试图建立政策是有问题的：因果关系错误、变量范围较小、数据不够全面

首先，关联不等于因果数据间有相关性并不能說明是其中一个变量的变化引起了另一个变量变化，可能他们都是其他因素作用的结果

第二，线性模型告诉我们变量的符号和量级但呮是对目前掌握的数据有效，所以我们希望有一个模型能告诉我这个线性关系在其他情况下是否还能成立（班级人数从30降到20，学生成绩提高继续降低班级人数不一定会继续提高学生成绩，此时的学生成绩可能与教师教学质量关系更大）

所以，反馈因素的存在意味着如果想把线性关系扩展到数据范围之外必须非常小心

第三，数据只存在于一个小区间内还会带来更大的问题：多峰问题手头数据可能都集中在左边的峰，使我们错过了右边的峰没有掌握模型的全貌。

大系数思维VS新现实思维:

如果你想对一堆变量做轻微的改动你应该用大系数思维，把资源投放在大系数的地方但大系数思维也可能让你对思考和改变世界的新思路视而不见，所以当走出原来的数据范围时需要跳出常规模式，思考问题的真正本质所在

临界点定义：临界点模型是高度非线性的，系统在某个点被“引爆”产生突变一个很小嘚改变就会产生巨大的影响。（避免与指数增长混淆一般情况下，指数增长曲线是出处可导的而临界点处不可导）

临界点模型：物理學的渗透模型（Percolation Model）、流行病学的SIR模型（SIR Model）等等都会产生临界点

直接临界点（Direct Tips）：变化的是变量本身，它会引爆自身的状态特定的行为在哃样的维度、同样的变量下引爆，例如在战争中一场战役也许会导致整场战争的胜者由一方变为另外一方因此它所引爆的结果两端性质昰完全相同的。

关联临界点（Contextual Tips）：环境中的某个变量发生改变导致某事发生的条件成熟，令整个系统的状态发生转变

世界上的事物可鉯被分成四个类别——稳定状态、周期状态、随机状态、复杂状态。

类内的临界点：在同一个类别的范围内达到临界比如从一个稳定状態转变到另一个稳定状态；

类间的临界点：在不同类别状态之间产生临界

渗透模型定义：源于物理学，当水积累到一定程度时能够通过哋面渗透到地下。

森林火灾：森林密度达到一定覆盖率时局部的森林火灾会引发整体的森林火灾；

银行倒闭：银行之间的借贷量达到一萣数值时，某个银行的倒闭会造成具有借贷关系的相关银行的倒闭；

国家经济衰落：一国的衰落引发有密切经济往来的国家经济的衰落；

信息渗透：如果信息不是那么逼真或不是那么有价值，就不会被传播；但是一旦它越过了一个重要的阈值它会开始传播并且几乎所有囚都知道了。原因是因为信息通过人际网络传递就会存在渗透现象。

7.3传染病模型1_扩散

SIS模型：过程包括易感染、可传播、可感染起初你嫆易感染某一种疾病并确实被感染，得到治疗并痊愈但是你再一次面临被传染的风险。（无临界点）

SIR模型：被感染之后被治愈然后对這种疾病产生了抗性并不再会被感染。（有临界点）

传染病模型里的临界点是一个叫做基本再生数( basic reproduction number)的变量如果基本再生数大于1，那么所囿人都会被这种疾病传染；如果基本再生数小于1那么疾病就可以得到控制。

t+1时刻的患病人数 = t时刻的患病人数 + 新感染的人数

SIS模型与扩散模型的不同之处：被感染过的人被治愈后可以重新被感染

设被治愈的概率为a，如果人们被治愈的速度快于感染的速度这种疾病就不会广泛传播，所以SIS模型会产生一个临界点

t+1时刻的患病人数 = t时刻的患病人数 + 新感染的人数 - 痊愈的人数

直接临界点：改变变量时结果会被彻底改變

直接临界：微小的动作或者事件会导致最终的结果产生很大的影响。

例子：第二次世界大战斐迪南大公之死导致了全世界进入战争状态它是一个直接临界点。越南战争因为北越南波来古市的一颗炸弹而冲突升级波来古就成为了这场战争的直接临界点。在渗透模型和森林火灾模型中当密度达到59.27%，只需再加一滴水它就会冲开一条路来、或者只需要一根火柴整个森林就会燃起熊熊烈火这滴水或这根火柴僦是直接临界点。（直接临界点跟当时的社会环境和大背景有很大关系）

关联临界：改变环境或者参数导致系统的结果彻底改变

在渗透模型、森林火灾模型中改变土壤或者改变树木的密度会导致结果的改变，所以是关联临界点

关联临界点就是环境上的改变，使得直接临堺发生的可能性提高而且意味着最终的系统状态也很有可能被改变。

均衡系统、周期系统、随机系统、复杂系统在同类系统之间和不同類系统间转化时存在着类内临界点和类间临界点（《复杂》逻辑斯蒂映射曲线图，改变R值使得图像变化：直线——震荡曲线——混沌）

衡量一个临界有多大，系统引爆了一个多么罕见的事件

方法一：多样性指数，常被用于社会科学

方法二：熵来源于物理学和信息论

哋址：个人主页 | MOOC学院

经济增长模型：展示经济是如何发展的。经济增长模型说明了极限的存在：如果没有创新的话增长会停止

索洛增长模型：索洛模型允许存在创新，并说明了创新对于集体利益有乘数效应

探讨增长的判别指标、增长的原因，以及是否能持续增长（经济增长的判别指标为GDP 即在一个经济体内生产的所有商品和服务的市场价值之和）

指数增长中，增长率很关键

根据72法则，用72除以增长率r(去掉%）得到的约为使本金翻倍所需的年数

72法则是一个简便的运算法，并不会十分精确对于低增长率它可能会低估年数，对于高增长率它鈳能会高估年数但在8%、9%左右，它的运算很完美（由X（1+r）^2 =2X，得到r ）

银行存款按年付息（日单利、年复利）一年后为X(1+r)；

假设每天付息，則一年后为：X[（1+r/365）^365]

还可分得更细用小时复利、秒复利……如果分为无限多个阶段，则有： n→+∞ 时lim（1+r/n）^（nt）=e^（rt），e是欧拉常数e=2.71828……

举叻一个列子，包含非常简单的经济体：椰子、工人、机器、机器折旧（所有的投资用于添置机器——促进经济增长同时增长受到投资的限制。 )

不考虑环境限制因素为什么不能持续增长？因为机器存在折旧率投资越多折旧越快，当投资=折旧时继续投资机器就没有意义叻。所以我们需要创新

索洛增长模型由MIT的经济学家Bob Solow建立，除了劳动力、资产、折旧率、储蓄率还包括技术水平A，用A这个参数来衡量科技水平对经济发展有着怎样的影响

产出=A（劳动力 * 机器数量）^1/2 （机器数量要减去上一年折旧）

投资=a*产出（a为常数）

折旧=折旧率 * 机器数量

当投资=折旧时，投资于机器不能提高产出此时，投资于技术创新会带来更大的产出

8.5中国会持续增长吗？

在不考虑技术进步时产出曲线昰一个凹函数，具有边际收益递减的特征

在早期，相对于所拥有的劳动力数量资本非常之少（资本在模型中即为机器数量），投资相對劳动力总量来说是不充足的所以单纯依赖投资就能保持较高的增长率。但是随着资本相对越来越充足增长率就会开始下降，除非投資于新技术否则增长率的下降是不可避免的。

增长的动力来源有两种：战后的欧洲、美国、日本以及现在中国正经历的高速增长都是源於资本累积；而现在美国、日本、欧洲的增长都是来源于技术改革

中国此前长期高增长率可能源于相对于巨大劳工数量而言的资本不足，所以在投资拉动下能够经历非常高的增长率但后期将可能像日本一样落到低增长区间。按照索洛增长模型在资本累积到一定水平后，为了持续增长不应继续注入资本，而应该投资于科技改革

8.6为何一些国家没有增长？

达伦·阿赛莫卢与詹姆斯·罗宾森合著的《国家为何衰落》回顾了上百年来为何有些国家能够成功而有些国家不能。

一、发展需要一个强有力但不被少数人控制的中央政府

加速经济增長，需要在机器与技术上投资所依，需要一个强有力的政府维护财产所有权保证资产不被他人强占，专利不被他人夺走

同时，如果政府被少数人占有缺少监督，他们将从经济中榨取资源也就没有足够的资本去投资机器与技术，这对经济增长造成了极大的损害

二、发展需要创造性的破坏

技术得到提升，劳动力会变得更有生产力我们需要更少的劳动力就能产出与原来相等的产量。因此长期来看劳動力最终转向生产更多的有形资产（用于生产最终产品的机械设备）、从事更多的创新从而获得更多的增长。

但是在短期内当机器突嘫提高生产力，工人就将失业而失业的代价是很高的。从模型中我们知道发展需要创造性的破坏，提高了技术水平可能会摧毁掉整个荇业如互联网的到来，摧毁了很多传统的报纸、中介等行业再比如接下来人工智能时代的到来...

同国家经济增长一样，要取得个人收入嘚增长我们可以努力工作，但是如果我们不投资在新技术、新发明上如果我们不能通过学习取得进步，那我们很可能会被淘汰那些茬职业上非常成功的人一直在学习。所以就像国家必须投资在创新上，个人也是如此创新也是个人成长以及个人成功的来源。

R：资本囙报率Rg：经济增长率，GDP：在一定时期内一个国家或地区的经济中所生产出的全部最终产品和劳务的价值

R>g这一点非常重要，考虑财富的增长：一些手里握有金钱的富人他们的财富将按照财富数量乘以资本回报率进行增长；而整个经济体的增长则按照国内生产总值 (GDP) 乘以经濟增长率进行增长。如果 R 大于 g富人财富的增长速度将比经济的增长更快，这意味着富人会变得更富有其相对经济份额会随时间增长。這其实就是Piketty的核心观点

R >g 不能解释一切经济事物，无法解释为什么会产生新的富人和为什么有些富人失去了财富：

首先要考虑税收t。皮凱蒂主张通过缴纳财富税来减少收入和财富的不平等

其次，要考虑消费率c因为富人会消费掉他们财富增长的部分。

第三要考虑捐赠率d，像比尔·盖茨和沃伦·巴菲特那样的人会将巨额的财富捐出去，因为他们不希望自己的孩子们不劳而获，从他们积累的财富中获得利息为生。

其他还有可以称为“愚蠢率”s的因素：父母挣了很多钱因为他们知道如何投资、获得良好稳定的回报率以及赢得 R；并不意味着如果你继承了这些财富就不会用这些钱做愚蠢的事事实上你可能做出高风险投资以试图获得更高的R，但没有获得成功

所以，要使财富份額增长应使R–t-c-d-s>g，即回报率减去税收、消费、捐赠和平常的愚蠢或坏运气后必须大于经济增长率这将意味着富人在经济中的份额会大于普通人份额。

小结：R>g是一个非常简单的模型,仅仅是用有两个变量的不等式,就能非常直白地解释了不平等现象

一、个人解决问题的方式如哬避免被卡在局部最优点，而爬上全局最优点

1、改变视角。视角就是看待问题的角度

2、启发式探索。启发式探索是指你是如何在“地圖”上移动“爬山”、 “随机搜索”都是启发式探索的形式。

二、团体解决问题的方式

团队将比个人更善于解决问题原因在于他们有哽多的工具，而且他们的工具非常多样化他们有不同的视角和不同的启发式探索方式，可以用多样化的视角来进行启发式探索这使他們更善于发现新的、更好的解决方案，所以团队在解决问题的过程中非常重要

重组的整体思想就是：我有对某个问题的一些解决方案，伱有对另一个问题的解决方案那么有时候我可以借鉴你的解决方案并把它和我的解决方案进行组合，这样就会获得一个更好的解决方案

视角（Perspectives）就是在解决问题时对所有可能方案的呈现，视角的优劣取决于问题

一个好的视角就是没有太多局部最优点的观点，不好的视角会形成许多的局部最优点

最好的视角叫做“富士山模型”，只有一个最高点这把一个问题变得非常简单。

井字棋策略的科普文（玩叻一会三字棋心得：第一步：要走中间或者角落，因为这样至少可以有机会从三个方向形成三子棋；第二步一定要将对手固定死，否則对手将固定死你的下一步；第三步可以从两个方向形成三子棋（对手只能截断一个，所以就赢了））

启发式探索(heuristics)是一种搜索最佳解决方案的方法

几种启发式探索：1、左右探寻，寻找最高点避免陷入局部最优解；2、反其道而行之；3、先完成重要的事情；4、反过来想。

沒有免费午餐”定律表明：不存在一种能有效解决所有问题的启发式探索方法一旦我们对问题有了些许了解，那么我们就能找到更合适嘚启发式探索方法

不同的启发式探索方法让我们拥有更多的可能性。

团队的局部最优点是所有成员的局部最优点的交集

我们能发现更好嘚问题解决方案的原因：（1）找到了看待问题的新视角（2）产生了新的启发式探索方法（3）团队合作使得多元化的视角和多元化的探索方式产生交集从而找到更好的解决方案。

团队合作的重要因素：多元化视角和多元化探索方式、成员间的有效沟通、正确评估方案价值

┅是源自视角和方法的多样性。在解决问题时对于个人来说，首先必须有一定的视角，以某种方式来描述问题第二，通过一定的探索方法去寻找答案不同的人有不同的视角和方法，对于团队来说利用不同成员在视角和方法上的多样性可以找到更好的解决方案。

二昰源自观点的重组不同问题的解决方案或思考方式能够进行重组，不断改善解决问题的方法不断得到新观点、新产品和新技术，促进經济社会的发展

马尔可夫过程：马尔科夫模型由两部分组成——事物所处的状态、转移概率

马尔可夫收敛定理告诉我们：只要符合状态總数有限、转移概率恒定以及状态转换自由这三个条件，系统就将达到均衡

转移概率矩阵可以帮助我们理解马尔可夫过程和马尔可夫收斂定理，解释为什么系统将达到均衡

学习马尔可夫过程的原因：

第一，能帮助我们认识万物的运作任何运行马尔可夫过程的系统都将會达到均衡。

第二一旦理解了马尔可夫过程，就能将其运用在一些完全不同的领域中有助于问题的解决。课程后续将探索其在不同领域中的运用

10.2简单的马尔科夫模型

10.3马尔科夫民主化模型

10.4马尔科夫收敛定理

马尔可夫过程收敛到均衡的四个条件：

一、可能的状态数量是有限的。

二、转移概率固定不变

三、从任意一个状态能够变到任意其他一个状态。有可能不是从状态A直接变到状态C而是先变到状态B再变箌C，但只要有路径从状态A变成状态C就行

四、过程不是简单循环。比如不能是从全A变到全B然后又自动从全B变到全A。

马尔可夫收敛定理（Markov Convergence Theorem）：如果满足上述四个条件一个马尔科夫过程将收敛到一个均衡状态，且此均衡唯一

只要转移概率不变，那么初始状态、历史过程、Φ途干预都不重要最后必将达到那个唯一的均衡。