在不确定信息的复杂环境下进行决策是现实中人们经常面对的困难之一,因此具有能够进行良好决策的能力被视为人工智能的重要能力之一.而游戏类型的博弈作为对现实世界的一种高度抽象,具有良定义、易检验算法优劣等特点,成为研究的主流.其中以掼蛋为代表的扑克类博弈不仅具有他人手牌未知这样的难点,还由于可选出牌动作与他人手牌情况数量庞大等特点,难以进行高效求解.因此,提出了一种软深度蒙特卡洛(soft deep Monte Carlo,SDMC)求解方法.该方法能够更好地融合领域知识,加快策略学习速度,并采用软动作采样策略调整实时决策,提升策略胜率.所提出的SDMC方法训练出的策略模型参加第2届“中国人工智能博弈算法大赛”时获得冠军.与第1届比赛冠军策略和第2届其他策略模型的实验对比证明了该方法在解决掼蛋扑克博弈中的有效性.
流动agent技术对于未来分布式系统的设计、实现和维护技术具有重要意义。它可有效地降低网络拥塞、克服网络隐患,其异步与自主运行特性提高了分布式系统的健壮性和容错能力。本文作者于1998年7月20日—7月24日参加了在比利时布鲁赛尔举行的第十二届欧洲面向对象程序设计会议。会上,General Magic公司的 ***作了“Mobile Objects and Mobile Agents:TheFuture of Distributed Computing?”的特邀报告。作者在该报告的基础上,结合自身工作,完成此文,供同行参考,希望能够对国内在此方面的研究有所推动。
暂无评论