Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах.Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Моралес Мигель
Мигель Моралес — старший инженер-исследователь в Lockheed Martin, Aeronautics-Advanced Development Programs (Skunk Works). Он читает курс «Обучение с подкреплением и принятие решений» в Технологическом институте Джорджии. Мигель работал во многих образовательных и технологических компаниях, включая Udacity, AT&T, Cisco и HPE.
Пока нет отзывов
Прекрасное введение в глубокое обучение с подкреплением с хорошим балансом между математическими выкладками, описанием понятий и примерами.
Агенты обучения с подкреплением, обладающие чертами человеческого поведения.
Применение обучения с подкреплением в сложных ситуациях.
Увлекательные задания, сопровождаемые кодом на Python, подробными комментариями и объяснениями.
Идеально подойдет для разработчиков с базовым опытом в области глубокого обучения.
Заказ обратного звонка
Спасибо за обращение!
Скоро с вами свяжется наш менеджер