节点文献

基于无监督学习的星际争霸2宏观决策

Unsupervised Learning Based Macro-Management in StarCraft Ⅱ

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 范腾邵坤唐振韬赵冬斌庞中华

【Author】 Teng Fan;Kun Shao;Zhentao Tang;Dongbin Zhao;Zhonghua Pang;The College of Electrical and Control Engineering,North China University of Technology;The State Key Laboratory of Management and Control for Complex Systems,Institute of Automation,Chinese Academy of Sciences;University of Chinese Academy of Sciences;

【机构】 北方工业大学中国科学院自动化研究所复杂系统管理与控制国家重点实验室中国科学院大学

【摘要】 本文针对不完全信息下的决策问题,提出一种基于无监督学习的决策方法。我们选择著名的即时战略游戏星际争霸2作为研究环境,介绍一种分析游戏录像的方法,利用无监督学习分析即时战略游戏中的宏观决策。首先,我们定义一个能够准确描述游戏状态的特征向量,为不同的宏观决策采取不同的提取方式构建数据集;然后,利用K均值聚类算法训练样本并得到分析结果;最后,基于分析结果提取的人类专家宏观决策经验构造智能体,并与游戏内置AI(Artificial Intelligence)对抗。结果证明,智能体宏观决策接近了人类玩家排名系统中前40%的水平。

【Abstract】 Aiming at the problem of decision-making under incomplete information, this paper proposes a decision method based on unsupervised learning. We focus on the famous real-time strategy game StarCraft II as the learning environment, and introduce a method of analyzing game replays with unsupervised learning to explore the decision-making in macro-management.Firstly, we define a feature vector to accurately describe the state of the game, and use different extraction methods for different macro-management to build a dataset. Then we train the samples to obtain experimental results. Finally, we construct an agent based on the macro-management experiences from human experts, to play against the build-in game AI. Experimental results show that the macro-management ability of the agent reaches the level of top 40% in human players.

【基金】 国家自然科学基金(61573353、61603382、61533017、61673023);北京市自然科学基金(4182019);北京高等学校高水平人才交叉培养“实培计划”毕业设计(科研类)项目资助
  • 【会议录名称】 2018中国自动化大会(CAC2018)论文集
  • 【会议名称】2018中国自动化大会(CAC2018)
  • 【会议时间】2018-11-30
  • 【会议地点】中国陕西西安
  • 【分类号】TP181;TP317
  • 【主办单位】中国自动化学会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络