Обработка естественного языка в действии
Практическое руководство.
Хобсон Лейн, Ханнес Хапке, Коул Ховард «Обработка естественного языка в действии» Питер, 2020 год, 576 стр., ISBN 978-5-4461-1371-2; (PDF, DJVU)
Описание книги.
Последние достижения в области глубокого обучения позволяют создавать приложения, с исключительной точностью распознающие текст и речь. Что в результате? Появляются чат-боты, ведущие диалог не хуже реальных людей, программы, эффективно подбирающие резюме под заданную вакансию, развивается превосходный предиктивный поиск, автоматически генерируются аннотации документов. Благодаря новым приемам и инструментам, таким как Keras и Tensorflow, сегодня возможно как никогда просто реализовать качественную обработку естественного языка (NLP).
"Обработка естественного языка в действии" станет вашим руководством по созданию программ, способных распознавать и интерпретировать человеческий язык. В книге рассказано, как с помощью готовых пакетов на языке Python извлекать из текста смыслы и адекватно ими распоряжаться. Дается расширенная трактовка традиционных методов NLP, что позволит задействовать нейронные сети, современные алгоритмы глубокого обучения и генеративные приемы при решении реальных задач, таких как выявление дат и имен, составление текстов и ответов на неожиданные вопросы.
Оглавление.
- Часть I. Машины для обработки слов
Глава 1. Знакомство с технологией NLP
Глава 2. Составление словаря: токенизация слов
Глава 3. Арифметика слов: векторы TF-IDF
Глава 4. Поиск смысла слов по их частотностям: семантический анализ - Часть II. Более глубокое обучение: нейронные сети
Глава 5. Первые шаги в нейронных сетях: перцептроны и метод обратного распространения ошибки
Глава 6. Умозаключения на основе векторов слов (Word2vec)
Глава 7. Сверточные нейронные сети
Глава 8. Нейронные сети с обратной связью: рекуррентные нейронные сети
Глава 9. Эффективное сохранение информации с помощью сетей с долгой краткосрочной памятью
Глава 10. Модели sequence-to-sequence и механизм внимания - Часть III. Поговорим серьезно. Реальные задачи NLP
Глава 11. Выделение информации: выделение поименованных сущностей и формирование ответов на вопросы
Глава 12. Начинаем общаться: диалоговые системы
Глава 13. Масштабирование: оптимизация, распараллеливание и обработка по батчам - Приложения
Приложение A. Инструменты для работы с NLP
Приложение Б. Эксперименты с Python и регулярные выражения
Приложение В. Векторы и матрицы: базовые элементы линейной алгебры
Приложение Г. Инструменты и методы машинного обучения
Приложение Д. Настройка GPU на AWS
Приложение Е. Хеширование с учетом локальности