Arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088 — различия между версиями
StasFomin (обсуждение | вклад) (Новая страница: «{{checked|}} {{arxivlink|arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088|…») |
(нет различий)
|
Текущая версия на 21:06, 9 декабря 2021
«Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088»скачать
Разрабатывается параллельный, быстрый и приближенный основанное на обучении решение для универсального класса Capacitated Vehicle Routing Проблемы с Time Windows и динамической маршрутизацией (CVRP-TWDR).
Учитывая транспортных средств в парке в качестве децентрализованных агентов, мы постулируем, что использование «Адаптация на основе обучения с подкреплением (RL)» является ключевым фактором для формирование маршрута в динамичной среде.
Методика позволяет каждому агенту (транспортное средство) для независимой оценки ценности обслуживания каждого клиента, и использует эвристику централизованного распределения для завершения распределения на основе сгенерированные значения. Мы показываем, что решения, полученные этим методом, являются значительно быстрее, чем точные формулы и современные технологии метаэвристика, достаточно близкая к оптимальной с точки зрения решения качество. Мы описываем эксперименты как в статическом случае (когда все покупатели требования и временные окна известны заранее), а также динамический случай (где клиенты могут появиться в любой момент во время выполнения).
Результаты с единственная обученная модель на больших тестовых данных вне распределения демонстрирует масштабируемость и гибкость предлагаемого подхода.
…»