Глубокое обучение с подкреплением
Теория и практика на языке Python.
Грессер Лаура, Кенг Ван Лун «Глубокое обучение с подкреплением» Питер, 2022 год, 416 стр., ISBN 978-5-4461-1699-7; (PDF-DJVU)
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL. Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Глубокое обучение с подкреплением. Теория и практика на языке Python
Оглавление
- Глава 1. Введение в обучение с подкреплением
Часть I. Алгоритмы, основанные на стратегиях и полезностях
Глава 2. REINFORCE
Глава 3. SARSA
Глава 4. Глубокие Q-сети
Глава 5. Улучшение DQN - Часть II. Комбинированные методы
Глава 6. Метод актора-критика с преимуществом (А2С)
Глава 7. Оптимизация ближайшей стратегии
Глава 8. Методы параллелизации
Глава 9. Сравнительный анализ алгоритмов - Часть III. Практика
Глава 10. Начало работы с глубоким RL
Глава 11. SLM Lab
Глава 12. Архитектура сетей
Глава 13. Аппаратное обеспечение - Часть IV. Проектирование сред
Глава 14. Состояния
Глава 15. Действия
Глава 16. Вознаграждения
Глава 17. Функция переходов - Приложения
Глубокое обучение с подкреплением. Теория и практика на языке Python
Добавить комментарий