Super-mario-bros-A3C-pytorch 超级马里奥的 A3C 算法 项目简介
Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros 是超级马里奥兄弟的 A3C 算法,用于训练代理玩超级马里奥兄弟。它可以:通过运行 python train.py 来训练模型 通过运行 python test.py 来测试已经过训练的模型样本示例:要求:python 3.6 gym cv2 pytorch numpy