Все вопросы: [reinforcement-learning]
5 вопросов
Улучшение Q-Learning
В настоящее время я использую Q-Learning, чтобы научить бота двигаться в комнате, заполненной стенами / препятствиями. Он должен начинаться в любом месте комнаты и достигать состояния цели (например, до плитки, на которой есть дверь). В настоящее время, когда он хочет перейти на другую плитку, о...
Как использовать нейронные сети для решения «мягких» решений?
Я подумываю об использовании нейронной сети для питания врагов в космическом шутере, который я создаю, и мне интересно;как тренировать нейронные сети, если для сети нет окончательного хорошего набора выходных данных?
Generalization functions for Q-Learning
I have to do some work with Q Learning, about a guy that has to move furniture around a house (it's basically that). If the house is small enough, I can just have a matrix that represents actions/rewards, but as the house size grows bigger that will not be enough. So I have to use some kind of ge...
Хорошие реализации обучения с подкреплением?
Для проекта AI-класса мне нужно реализовать алгоритм обучения с подкреплением, который превосходит простую игру в тетрис. Игра написана на Java и у нас есть исходный код. Я знаю основы теории обучения с подкреплением, но мне было интересно, есть ли у кого-нибудь в сообществе SO практический опыт...
Как мне запустить Лисп-код Саттона и Бартона для обучения с подкреплением?
В последнее время я много читал об обучении с подкреплением и обнаружил «Обучение с подкреплением: введение» , чтобы быть отличным руководством. Автор услужливо предоставил исходный код многих своих рабочих примеров. Прежде чем я начну задавать вопрос, я должен указать, что мои практичес...