国产人形机器人的“手”超越特斯拉 能打麻将、做家务
王涛介绍,以抓取动作为例,大致可以分为解析法和数据驱动法两类,解析法是灵巧手通过数学解算、物理计算等方式形成抓取方案,但实际情况是,许多参数无法被准确解析,如抓取摩擦系数、正压力、接触点位姿等。因此目前最常用的还是数据驱动法,即通过现有标注好的数据进行训练学习。从硬件来看,类似ShadowHand灵巧手的自由度...
让绝艺上桌打麻将,腾讯AI Lab全新策略优化算法战胜人类冠军
在该工作中,我们引入了一类新的CFR算法:WeightedCFR。WeightedCFR有如下定义:算法ACH可以看作是一类基于神经网络的WeightedCFR算法的一个高效实现。我们证明了WeightedCFR的算法收敛性,进而近似证明了ACH的算法收敛性:另外,针对1v1麻将的具体神经网络设计如下实验结果在对比主流方法的基础...
麻将AI算法能用于投资预测? 微软揭秘研发细节
在非完美信息博弈中,麻将属于非常复杂的类型。”刘铁岩举了一个例子,麻将牌有136张,在开局时的排列组合是6人德州扑克的10的90次方倍;开局后一个玩家的手牌确定了,但他看不到其他三个玩家的手牌,这些隐藏信息有高达10的48次方种可能。
微软Suphx,创造了哪些人工智能新算法?
即便是Zero看起来比AlphaGo前进了一大步,洪小文认为,“那其实也只是一个必然,只是需要更多的计算力,所以云计算才那么重要。”从这样的维度看,麻将AI比围棋、象棋AI要难得多,要高级得多,因为麻将身上有海量的隐藏信息、复杂的奖励机制和巨大的状态空间,它不仅仅是有简单算法和强大计算力就能够完成。Suphx发明了什么?
腾讯AI Lab「绝艺」LuckyJ登顶国际麻将平台
另一方面,目前的AI在围棋和德州扑克上的成功很大程度依赖于搜索算法,因为搜索可以最大程度地发挥计算机的计算优势。但是由于麻将巨大的隐藏信息存在,环境不确定性较大,传统非完美信息搜索算法在麻将面前很难发挥同样的功效。具体来说,过去一系列非完美信息搜索算法的算法复杂度是隐藏信息数量的平方,这对于德州扑克来...
微软麻将AI超越99%人类玩家,它的十段功力是如何修炼的
任意一位玩家的吃碰杠以及胡牌都会改变摸牌的顺序,因此研究员们很难为麻将构建一棵规则的博弈树(gametree)(www.e993.com)2024年11月28日。即使去构建一棵博弈树,那么这棵博弈树也会非常庞大,并且有不计其数的分支,导致以前一些很好的方法,如蒙特卡洛树搜索(MCTS)、蒙特卡洛反事实遗憾最小化(MCCFR)算法等都无法直接被应用。
微软亚洲研究院解密:AI Suphx是如何成为麻将十段的?
Suphx训练算法Suphx训练过程分为三个主要步骤:首先使用来自天凤平台的高手打牌记录,通过监督学习来训练这5个模型,然后使用自我博弈强化学习以及由微软亚洲研究院Suphx研发团队设计的两个技术解决麻将本身的独特性所带来的挑战,最后在实战时采用在线策略自适应算法来进一步提高Suphx的能力。
麻将AI难在哪?微软宣布公开麻将AI Suphx 的十段秘籍
Suphx训练算法Suphx训练过程分为三个主要步骤:首先使用来自天凤平台的高手打牌记录,通过监督学习来训练这5个模型,然后使用自我博弈强化学习以及由微软亚洲研究院Suphx研发团队设计的两个技术解决麻将本身的独特性所带来的挑战,最后在实战时采用在线策略自适应算法来进一步提高Suphx的能力。
国内首例!72岁高位截瘫患者用意念喝可乐、打麻将
由于脑机接口技术同时依赖患者脑电信号特征及机器算法设计,目前还没有统一标准化的信号采集、解码等分析手段,也就是说,不能直接搬用已有的分析手段。事实上,在研究过程中团队也验证了这一点。他们一开始用国外的几套线性算法,效果都不太好。后来,王跃明与团队成员引入非线性、神经网络算法,提出了针对这一例高龄患者...
ICLR 2022|让绝艺上桌打麻将,腾讯AI Lab全新策略优化算法战胜人类...
在对比主流方法的基础上,该算法的优越性在1v1麻将(战胜职业冠军)和1v1德州扑克上均得到了验证。二人麻将:「二人雀神」1v1麻将(二人雀神)测试中,「绝艺」与世界冠军职业选手对战1000回合,平均赢番0.82(标准差0.96,单边t检验的pvalue为0.19)...