Arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088 — различия между версиями

Материал из DISCOPAL
Перейти к: навигация, поиск
(Новая страница: «{{checked|}} {{arxivlink|arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088|…»)
 
(нет различий)

Текущая версия на 21:06, 9 декабря 2021

«

Разрабатывается параллельный, быстрый и приближенный основанное на обучении решение для универсального класса Capacitated Vehicle Routing Проблемы с Time Windows и динамической маршрутизацией (CVRP-TWDR).

Учитывая транспортных средств в парке в качестве децентрализованных агентов, мы постулируем, что использование «Адаптация на основе обучения с подкреплением (RL)» является ключевым фактором для формирование маршрута в динамичной среде.

Методика позволяет каждому агенту (транспортное средство) для независимой оценки ценности обслуживания каждого клиента, и использует эвристику централизованного распределения для завершения распределения на основе сгенерированные значения. Мы показываем, что решения, полученные этим методом, являются значительно быстрее, чем точные формулы и современные технологии метаэвристика, достаточно близкая к оптимальной с точки зрения решения качество. Мы описываем эксперименты как в статическом случае (когда все покупатели требования и временные окна известны заранее), а также динамический случай (где клиенты могут появиться в любой момент во время выполнения).

Результаты с единственная обученная модель на больших тестовых данных вне распределения демонстрирует масштабируемость и гибкость предлагаемого подхода.

…»