Arxiv/RP-DQN — An application of Q-Learning to Vehicle Routing Problems 2021 2104.12226 — различия между версиями

Материал из DISCOPAL
Перейти к: навигация, поиск
(Новая страница: «{{checked|}} {{arxivlink|arxiv/RP-DQN — An application of Q-Learning to Vehicle Routing Problems 2021 2104.12226| В этой статье мы представ…»)
 
(нет различий)

Текущая версия на 21:02, 9 декабря 2021

«

В этой статье мы представляем новый подход к решению сложных проблем маршрутизации. с улучшенным представлением состояния, которое лучше использует сложность модели чем предыдущие методы.

Мы делаем это возможным благодаря тренировкам с учетом временных различий. В частности, используется Q-Learning. Мы показываем, что наш подход позволяет ультрасовременная производительность для политики авторегрессии, которая последовательно вставьте узлы для построения решений на CVRP.

Кроме того, мы первые решить MDVRP с помощью методов машинного обучения и продемонстрировать, что это тип задачи значительно выигрывает от нашего подхода по сравнению с другими методами машинного обучения.

…»