Hadoop. Введение в Big Data и MapReduce

Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс "Методы распределенной обработки больших объемов данных в Hadoop"
Лекция №1 "Введение в Big Data и MapReduce"
Лектор - Алексей Романенко.


Что такое «большие данные». История возникновения этого явления­. Необходимые знания и навыки для работы с большими данными. Что такое Hadoop, и где он применяется. Что такое «облачные вычисления», история возникновения и развития технологии. Web 2.0. Вычисление как услуга (utility computing). Виртуализация. Инфраструктура как сервис (IaaS). Вопросы параллелизма. Управление множеством воркеров. Дата-центры и масштабируемость. Типичные задачи Big Data. MapReduce: что это такое, примеры. Распределённая файловая система. Google File System. HDFS как клон GFS, его архитектура.







Видеотека

Яндекс.Метрика