Data Science. Инсайдерская информация для новичков. Включая язык R
Учебный курс.
О’Нил Кэти, Шатт Рэйчел «Data Science. Инсайдерская информация для новичков. Включая язык R.»Питер, 2019 год, 368 стр., ISBN 978-5-4461-0622-6; (PDF)
Описание книги.
Data Science (исследование данных) — одна из самых востребованных специализаций нашего времени. Изучение данных позволяет преобразить любую традиционную или инновационную бизнес-модель. Эта книга устроена как учебный курс. Она основана на вводном курсе по Data Science из Колумбийского университета, и начинающему специалисту-аналитику она совершенно необходима. В ней увлекательно и доступно рассказано о байесовском методе, статистических алгоритмах, финансовом моделировании, рекомендательных движках, MapReduce и др.
Обзор начинается со статистического моделирования и алгоритмов машинного обучения, что послужит в качестве базы для остальной части книги. Затем будут рассмотрены конкретные примеры моделей и алгоритмов в контексте, а также визуализация данных, социальные сети, прогнозирование данных и подготовка их к инжинирингу. Завершит книгу рассказ о перспективах развития науки о данных в будущем. Предполагается, что читатель знаком с линейной алгеброй, имеет представление о теории вероятности и статистике, а также некий опыт программирования на любом языке.
Data Science. Инсайдерская информация для новичков. Включая язык R.
Оглавление.
Глава 1. Введение: что такое наука о данных
Глава 2. Статистический анализ, разведочный анализ данных и процесс их научного исследования
Глава 3. Алгоритмы
Глава 4. Фильтры спама, наивный классификатор Байеса и перебор данных
Глава 5. Логистическая регрессия
Глава 6. Метки времени и финансовое моделирование
Глава 7. Извлечение смысла из данных
Глава 8. Рекомендательные механизмы: создание ориентированных на пользователя масштабируемых информационных продуктов
Глава 9. Визуализация данных и выявление мошенничества
Глава 10. Социальные сети и журналистика данных
Глава 11. Причинность
Глава 12. Эпидемиология
Глава 13. Уроки, извлеченные из соревнований по данным: утечка данных и оценка моделей
Глава 14. Проектирование данных: MapReduce, Pregel и Hadoop
Глава 15. Мнения студентов
Глава 16. Исследователи данных нового поколения, завышенная самооценка и этика
Data Science. Инсайдерская информация для новичков. Включая язык R.
Data Science для начинающих.
PDF (RU) pdf (ru) Доп. материал на Github
key GRNrbXF9dooRxMZ0nqsv9mV6DspxIViWU8kENPWHG98
Добавить комментарий