Анализ больших наборов данных. Джеффри Д. Ульман и др.
- Тип: Текст PDF
- Авторы:
- Издательство: ДМК Пресс(2017)
- Год написания: 2014
- ISBN: 978-5-97060-190-7, 978-5-04-041758-2
- Страниц: 500
- Язык: Русский
- Жанры: Программы, Зарубежная компьютерная литература, Базы данных
- Теги:
- Описание
- Фрагмент
Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining). В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Издание будет в равной мере полезна студентам и программистам-практикам.