BDAM: Аналитика больших данных для руководителей
Details
Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических методов и техник, применяемых для поиска и извлечения знаний из больших массивов разнородных данных. Сравнение различных версий дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики данных, «open source« и коммерческие инструменты используемые для хранения, обработки, визуализации и аналитики больших данных.
Программа курса
Введение в Big Data (Большие данные)
Большие данные и цифровая трансформация
Методы аналитики больших данных
Отраслевая специфика аналитики больших данных
Жизненный цикл аналитики данных: Получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
Data Mining — извлечение знаний из больших данных
Задачи Data Mining
Техники Data Mining
Классификация и кластеризация
Прогнозирование и визуализация
Ассоциативные правила и обнаружение аномалий
Методология CRISP-DM
Инструменты Data Mining
Специфика применения Data Mining для разных отраслей бизнеса с примерами
Машинное обучение для Data mining
Основные определения
Задачи и область применения машинного обучения
Supervised/unsupervised машинное обучение
Инструменты и технологии машинного обучения
Data mining в социальных сетях
Введение в анализ социальных сетей и теорию графов
Базовые алгоритмы на графах и основные возможности графового анализа
Феномен маленького мира
Выделение важных узлов в социальных сетях
Инструменты и методы визуализации графов для применения в бизнесе
Инструментарий для работы с Big Data
Специфика работы с Big Data
Аналитика для неструктурированнных данных с использованием Hadoop
Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive, и т.д.)
Сравнительный анализ Hadoop дистрибутивов (Cloudera, Horton Works, MapR) и инструментария аналитика данных на примерах использования
Сравнительные характеристики программных и аппартных решений для реализации решений по Big Data
Облачные платформы (AWS, EMR, Azure) для реализации решений по Big Data
Средства визуализации для аналитики данных.
Интеграция Больших данных
Основные принципы работы с Big Data
Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
Пакетная и динамическая загрузка данных
Правовые аспекты организации защиты персональных данных
Правовое регулирование в области защиты персональных данных
Международная практика в области защиты персональных данных
Права субъекта и обязанности оператора при обработке персональных данных
Виды нарушений безопасности персональных данных
GDRP
С чего начать?
Формирование команды проекта Big Data. Ключевые роли
Специфика рынка данных и аналитики
Отличия подходов Business Intelligence и Data Science
Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.
Подробнее о наших курсах https://www.bigdataschool.ru/bigdata/big_data_analytics_for_executives.html
