Задача балансировки трафика является актуальной в современных сетях, имеющих множество альтернативных маршрутов между любой парой абонентов. Балансировка позволяет достигнуть равномерной загрузки сетевых ресурсов. В работе предлагается метод адаптивной настройки политики очередизации на коммутаторе для достижения равномерной загрузки очередей на выходных портах коммутатора. В связи с тем, что современные приложения ограничивают задержку на передачу данных миллисекундами, в работе был применен один из методов машинного обучения с подкреплением DQN для решения поставленной задачи. Экспериментальное исследование продемонстрировало схо- димость предложенного метода в процессе обучения к равномерной загрузке очередей на выходных портах.
Ключевые слова:
адаптивная настройка политики очередизации, методы машинного обучения, DQN, коммутатор, обучение с подкреплением