Arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088
«Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088»скачать
Разрабатывается параллельный, быстрый и приближенный основанное на обучении решение для универсального класса Capacitated Vehicle Routing Проблемы с Time Windows и динамической маршрутизацией (CVRP-TWDR).
Учитывая транспортных средств в парке в качестве децентрализованных агентов, мы постулируем, что использование «Адаптация на основе обучения с подкреплением (RL)» является ключевым фактором для формирование маршрута в динамичной среде.
Методика позволяет каждому агенту (транспортное средство) для независимой оценки ценности обслуживания каждого клиента, и использует эвристику централизованного распределения для завершения распределения на основе сгенерированные значения. Мы показываем, что решения, полученные этим методом, являются значительно быстрее, чем точные формулы и современные технологии метаэвристика, достаточно близкая к оптимальной с точки зрения решения качество. Мы описываем эксперименты как в статическом случае (когда все покупатели требования и временные окна известны заранее), а также динамический случай (где клиенты могут появиться в любой момент во время выполнения).
Результаты с единственная обученная модель на больших тестовых данных вне распределения демонстрирует масштабируемость и гибкость предлагаемого подхода.
…»
[ Хронологический вид ]Комментарии
Войдите, чтобы комментировать.