Все вопросы: [reinforcement-learning]

5 вопросов

1
голосов
2ответов
1010 просмотров

Улучшение Q-Learning

В настоящее время я использую Q-Learning, чтобы научить бота двигаться в комнате, заполненной стенами / препятствиями. Он должен начинаться в любом месте комнаты и достигать состояния цели (например, до плитки, на которой есть дверь). В настоящее время, когда он хочет перейти на другую плитку, о...

5
голосов
4ответов
2765 просмотров

Как использовать нейронные сети для решения «мягких» решений?

Я подумываю об использовании нейронной сети для питания врагов в космическом шутере, который я создаю, и мне интересно;как тренировать нейронные сети, если для сети нет окончательного хорошего набора выходных данных?

1
голосов
1ответов
975 просмотров

Generalization functions for Q-Learning

I have to do some work with Q Learning, about a guy that has to move furniture around a house (it's basically that). If the house is small enough, I can just have a matrix that represents actions/rewards, but as the house size grows bigger that will not be enough. So I have to use some kind of ge...

23
голосов
9ответов
5961 просмотров

Хорошие реализации обучения с подкреплением?

Для проекта AI-класса мне нужно реализовать алгоритм обучения с подкреплением, который превосходит простую игру в тетрис. Игра написана на Java и у нас есть исходный код. Я знаю основы теории обучения с подкреплением, но мне было интересно, есть ли у кого-нибудь в сообществе SO практический опыт...

7
голосов
5ответов
1239 просмотров

Как мне запустить Лисп-код Саттона и Бартона для обучения с подкреплением?

В последнее время я много читал об обучении с подкреплением и обнаружил «Обучение с подкреплением: введение» , чтобы быть отличным руководством. Автор услужливо предоставил исходный код многих своих рабочих примеров. Прежде чем я начну задавать вопрос, я должен указать, что мои практичес...