Arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088

Материал из DISCOPAL
Версия от 21:06, 9 декабря 2021; StasFomin (обсуждение | вклад) (Новая страница: «{{checked|}} {{arxivlink|arxiv/Fast Approximate Solutions using Reinforcement Learning for Dynamic Capacitated Vehicle Routing with Time Windows 2021 2102.12088|…»)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

«

Разрабатывается параллельный, быстрый и приближенный основанное на обучении решение для универсального класса Capacitated Vehicle Routing Проблемы с Time Windows и динамической маршрутизацией (CVRP-TWDR).

Учитывая транспортных средств в парке в качестве децентрализованных агентов, мы постулируем, что использование «Адаптация на основе обучения с подкреплением (RL)» является ключевым фактором для формирование маршрута в динамичной среде.

Методика позволяет каждому агенту (транспортное средство) для независимой оценки ценности обслуживания каждого клиента, и использует эвристику централизованного распределения для завершения распределения на основе сгенерированные значения. Мы показываем, что решения, полученные этим методом, являются значительно быстрее, чем точные формулы и современные технологии метаэвристика, достаточно близкая к оптимальной с точки зрения решения качество. Мы описываем эксперименты как в статическом случае (когда все покупатели требования и временные окна известны заранее), а также динамический случай (где клиенты могут появиться в любой момент во время выполнения).

Результаты с единственная обученная модель на больших тестовых данных вне распределения демонстрирует масштабируемость и гибкость предлагаемого подхода.

…»

[ Хронологический вид ]Комментарии

(нет элементов)

Войдите, чтобы комментировать.