AI技术不止于大数据 未来或还能“战略博弈”
【摘要】在未来,AI能不能用来改善人类的战略逻辑?AI技术必须要依靠大数据吗?

金评媒(https://www.jpm.cn)编者按:在未来,AI能不能用来改善人类的战略逻辑?AI技术必须要依靠大数据吗?
“完美信息和非完美信息的游戏两者本质不一样,AlphaGo所应用的技术不可以应用到扑克游戏里面”,在11月6日举办的京东金融全球数据探索者大会上,卡耐基梅隆大学计算机系教授、德扑AI之父托马斯·桑德霍姆探讨了“超人类”的AI技术如何进行战略性的分析和推理,并接受了财新记者专访。
AlphaGo的训练过程一直被视为是基于大数据的深度学习,但桑德霍姆认为,人工智能不光局限于此,还有一些新的技术和领域,成为战略性逻辑,是战略博弈的一部分。
桑德霍姆表示,AlphaGo的技术可以用于所有完美信息游戏。所谓完美信息游戏,是指双方都掌握对等信息的游戏,在其中,一个大游戏可以分解成各小的子游戏,机器通过别的子游戏的结论就可以学习。比如在防御的时候,只用观察其中的一步怎么样做,就能学习,比如围棋游戏。
而在非完美信息的游戏中,玩家并不知道对手手中是什么牌,所以在一个子游戏学到的,无法用于另一个子游戏,比如德州扑克。
“我不知道我的扑克对手的以往的行动,他也不知道我的,我们也不知道对手背后的盘算,对手的行动对我有怎样的启示?我怎样通过对手的行动来推测到背后的动机,我的行动泄露了我的哪些意图?” 桑德霍姆以德州扑克游戏为例,描述了会遇到的各类复杂情形。
桑德霍姆团队开发的冷扑大师Libratus在与真人对打的扑克牌比赛中,打败了诸多德州扑克高手,其中包括中国的龙之队。
桑德霍姆详细介绍了冷扑大师运行背后设计的原理,采用了他们已验证正确的技术,并没有采用基于大数据的深度学习。他表示,冷扑大师是从零开始学习德州扑克的,主要是在了解既定的游戏规则之后,依靠自我的对局来学习,“好像是对着镜子给自己进行拳击,然后突然跳起来飞踢(拳王)泰森”。因而,冷扑大师的打法并不跟AlphaGo类似,是不靠人类经验的,而更多的是“博弈”的过程,并能够根据对手的行为,来发现战略漏洞,进行“自我改善”。
在现实生活中,类似围棋的“完美信息”场景是少见的,更多的是类似德州扑克这种“非完美信息”场景,充满随机性和信息隐匿。机器如果能够“战略博弈”,可能被更多被用于现实。桑德霍姆提出了几种被运用的可能性,如在定价中,可以根据竞争对手的价格变化,来进行战略性定价;在拍卖活动中,在没有人知道底价的情况下,进行合理的竞猜;对于电影版权,帮助流媒体公司构建更好的视频流组合,进行更好的谈判。此外,还可能运用到的领域涵盖驾驶规则管理、患者健康管理等。
桑德霍姆对财新记者表示,“我们为非完美信息游戏制定的这种战略推理(stragetic reasoning)在金融领域有许多的应用,尤其是对投资组合经理(portfolio manager)交易,在建立产品组合和执行交易的时候,都需要战略推理。因为当进行大型交易的时候,其实是将市场放在了对立面。”
“我们使用眼镜改善我们的视力,为什么不能用AI来改善自己的战略逻辑呢?” 桑德霍姆说。
(编辑:杨少康)
来源: 财新网 李明明 张榆

财经360



- 情报 | 威马汽车年亏损82亿元远超“蔚小理”;乐视经典商标Le将被拍卖;福特因车标短缺致使车辆无法正常交付
- 情报 | 恒大汽车被限制消费;币安美国子公司急寻银行接盘;B站UWP版本停止维护
- 情报 | 银保监会约谈前海人寿实控人姚振华;跨境电商Shein最快2024年在美IPO;女子称买9本书全盗版起诉当当网
- 情报 | 2021中国新经济企业500强出炉;易趣网宣布将于8月12日关闭;开课吧被强制执行106万
- 情报 | 中公教育及高管受罚一千万;马斯克以440亿美元收购推特;荣耀回应“2022年上市并筹资450亿美元”传闻
- 情报 | 苹果今明两年有望取代三星;OpenAI宣布推出企业版ChatGPT;林肯汽车2025年推出首款电动跨界车
- 情报 | 银湖网爆雷4年余波来了;55款App侵犯个人信息被下架;天涯社区被执行总额超亿元
- 情报 | 绿驰汽车被吊销营业执照;正畸品牌「微笑公式」被曝倒闭清算;恒大地产再被强制执行近4.7亿
- 情报 | 圆通副总裁被立案;小米汽车首款车型SU7路试谍照曝光;特斯拉明年将推出新款高性能版Model 3
- 情报 | 小米开启年底裁员;图森未来拟裁员至少一半;微软将于明年2月14日永久禁用IE