自动驾驶端到端方案与安全的底层逻辑
当然,博弈论很庞大,有很多复杂分类,例如合作博弈、非合作博弈,或者动态博弈、静态博弈,还有完全信息博弈、不完全信息博弈等,那么分别对应的均衡概念也不同,例如子博弈精炼纳什均衡,贝叶斯纳什均衡等等。我们只是借助博弈论思维去理解和探索端到端方案与安全的关系,所以对这些复杂理论不展开说明,只要大概了解什么是博弈、什...
揭秘经济学与博弈论的基石:纳什均衡深度剖析
囚徒困境:经典的囚徒困境是理解纳什均衡的最佳例子。两个共谋犯罪的囚徒被隔离审讯,他们面临坦白或不坦白的选择。在不知对方选择的情况下,出于自保的理性考虑,两人最终都选择坦白,尽管合作保持沉默对他们更有利。这一结果正是纳什均衡的体现。价格战:在市场竞争中,商家为争夺市场份额可能会进行价格战。当所有商家都预...
群论遇上博弈论
答:博弈论中很多经典的例子,比如囚徒困境、性别大战,以及硬币匹配博弈,都有一定的对称性。但是按照我们教科书中对对称博弈的定义,只有囚徒困境是对称的,性别大战和硬币匹配博弈都不是。那么如何严格定义进而充分理解这些直观上不同的对称呢?我们2018年发表于MathematicalSocialSciences的工作发现可以使用对称群定义三种...
合作or 背叛:博弈论里的囚徒困境怎么解决?
??从前文可以得出这样的结论:在“重复囚徒困境”,也即非零和博弈中,合作是过更好的选择。作者在书中举了一个现实的例子:在第一次世界大战堑壕战中,敌对的士兵经常表现出很大的克制,双方似乎都默契地执行着“自己活也让别人活”的策略。这种现象是堑壕战的特产。因为在堑壕战中,敌对双方都需要长时间对峙,符...
《底层逻辑2》:拼命寻找世界的真相
关于博弈论的重要概念也有很多,我仅举一例:收益矩阵。收益矩阵,又叫支付矩阵,又叫报酬矩阵,又叫赢得矩阵,又叫得益矩阵。很多名字,但都有“矩阵”这两个字。因为一旦决策者从单人,变为至少双人,决策的结果,就从一维的“得失”,变为二维的“利害关系”问题了。
经典综述:自由能原理——统一的大脑理论
7.最优控制理论和博弈论价值(value)是基于强化学习和最优控制理论的大脑功能理论的核心(www.e993.com)2024年11月11日。这些理论的基本观念是大脑优化价值,这里价值被理解为预期的奖励或效用(或者相对应的,预期的损失或成本)。在行为心理学领域,这被称为强化学习[98];在计算神经科学和机器学习领域,这体现为动态规划的变体,如时序差分学习...
如何用数学思维,理解商业世界的底层逻辑
6.博弈论希望这些数学知识,能为你带来洞察之眼、深思之心,让你看透商业的本质,在商业世界里走得更远,飞得更高。但是,我知道,我理解,我都懂。数学,可能也伤害过你。但请相信我,作为数学专业的毕业生,我可以很负责任地说,数学一点都不难。
蝌学荐书 | 让你爱上数学的生活手账,这些数学思维帮你看清数学的...
让我们看一个著名的博弈论例子:囚徒困境。在这个故事里,一个歹徒和同伙抢了银行。抢完之后,歹徒把钱藏在了银行门外的一个垃圾箱里,然后开着车飞快地逃走了。在离银行不远的地方,歹徒被抓住了,同伙也被抓了。他们被带到警察局,关在不同的房间里。由于他们都持有枪械,两个人可能都会被指控非法持有武器。尽管...
真正厉害的人,都拥有这八种“数学”思维
七、博弈论:尽可能合作在数学领域,博弈论中所谓的“博弈”是一场决策者之间的策略互动。让我们看一个著名的博弈论例子:囚徒困境。在这个故事里,一个歹徒和同伙抢了银行。抢完之后,歹徒把钱藏在了银行门外的一个垃圾箱里,然后开着车飞快地逃走了。在离银行不远的地方,歹徒被抓住了,同伙也被抓了。他们被带到...
是什么让他成为现代计算机之父?丨纪念冯·诺伊曼诞辰120周年(下)
这种方法的另一个例子是,给定一组函数方程,试图将其转换为具有概率论或博弈论解释的等价方程。人们在计算机上将这些等价方程进行模拟,以表示随机过程,所获得的分布将对原始方程的解给出一个合理的推测。更进一步,希望直接获得所讨论的物理系统行为的“同态象”。必须指出的是,在目前研究的许多物理问题中,最初通过某些...