Бесплатная доставка при покупке от 700 рублей* Бесплатная доставка при покупке от 700 рублей действует при выборе пунктов выдачи Boxberry или 5post.
Издательский Дом "Питер"
Магазин Издательство Новости Авторам Rights
Войти / Регистрация
0 = 0 р.
Итого: 0 р.
8 (800) 500 42 17
Время работы:
Пн-Пт: с 10:00 до 18:00

Время работы:
Пн-Пт: с 10:00 до 18:00

 
Новинки Бестселлеры Скоро Рекомендуем
Главная > Авторы > От Й до М > Лапань Максим > Глубокое обучение с подкреплением. AlphaGo и другие технологии
Глубокое обучение с подкреплением. AlphaGo и другие технологии

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Лапань М.

  • Тема: Для профессионалов
  • Год: 2020
  • Страниц: 496
  • Вес: 634 г.
  • Обложка: Мягкая обложка
  • Формат: 165х233х23 мм
  • ISBN: 978-5-4461-1079-7
Бумажная книга
(+ pdf, epub)
 
 
Цена:
1710 р.
Оглавление Полистать
  • Описание
  • Отзывы
  • Файлы для скачивания
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге
- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.
- Изучите основу RL: марковские процессы принятия решений.
- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.
- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.
- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.
- Реализуете метод AlphaGo Zero для игры в Connect4.
- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Пока нет отзывов

Оставить отзыв

CAPTCHAОбновить изображение

Наберите текст, изображённый на картинке

Все поля обязательны к заполнению

Перед публикацией отзывы проходят модерацию



Мы в социальных сетях:
Youtube
Telegram
Vkontakte
habrahabr.ru
Наши детские аккаунты:
www.piterdetstvo.com
Telegram
Vkontakte
Психология. Питер:
psy.piter.com
Telegram
 
 
Помощь
Соглашение о продаже Как заказать Доставка товаров Способы оплаты Акции и скидки Обратная связь Возврат Оформление заказа Файлы к книгам Дисконт (Незначительный брак)
Издательство
Партнерская программа Приглашаем авторов Рекламодателям Книги под заказ Книготорговым организациям Rights Совместные покупки Партнеры
О нас
О компании Новости Где купить Контакты Вакансии

Подписка
Электронный адрес *
Имя
Фамилия



Mailigen Email маркетинг
* Обязательные поля

Наши реквизиты:ООО «Мейл Плюс»
ИНН 7802524386 КПП 780201001
Реквизиты р /с получателя: 40702810955080005460 в СЕВЕРО-ЗАПАДНЫЙ БАНК ПАО СБЕРБАНК г. Санкт-Петербург
к/с 30101810500000000653, БИК 044030653
Юр. адрес: 194044, г. Санкт-Петербург, Большой Сампсониевский пр-кт, дом № 29, литера А
Почтовый адрес: 194044, г. Санкт-Петербург, Большой Сампсониевский пр-кт, дом № 29, литера А

Заказ обратного звонка

Спасибо за обращение!
Скоро с вами свяжется наш менеджер