Arxiv/POMO — Policy Optimization with Multiple Optima for Reinforcement Learning 2020 2010.16011 — история изменений

Материал из DISCOPAL
Перейти к: навигация, поиск

Выбор версий: отметьте версии страницы, которые вы хотите сравнить, и нажмите Сравнить.
Пояснения: (текущ.) — отличия от текущей версии; (пред.) — отличия от предшествующей версии; м — незначительные изменения.

  • (текущ. | пред.) 21:27, 9 декабря 2021StasFomin (обсуждение | вклад). . (2842 байта) (+2842). . (Новая страница: «{{checked|}} {{arxivlink|arxiv/POMO — Policy Optimization with Multiple Optima for Reinforcement Learning 2020 2010.16011| В нейро-комбинаторн…»)