有關MuZero的科普精選

2016-12-02 DeepMind的一項研究提出了MuZero演算法，該演算法在不具備任何底層動態知識的情況下，通過結合基於樹的搜尋和學得模型，在雅達利2600遊戲中達到了SOTA表現，在國際象棋、日本將棋和圍棋的精確規劃任務中可以匹敵AlphaZero，甚至超...