Что мы из себя представляем

Наша компания «Школа Больших Данных» (https://www.bigdataschool.ru) предлагаем уникальные практические курсы по Big Data (большие данные) а также материалы, новости, документы по следующим направлениям: Большие данные, Data Mining, Internet of Things, Industrial Internet of Things, цифровая трансформация, компоненты экосистемы Hadoop, Apache Spark,Kafka, NiFi, AirFlow,HBase, NoSQL, построение распределенных кластерных систем хранения больших данных и озер данных (Data Lakes) на платформах Cloudera Distributed Hadoop, Аренадата Hadoop, HortonWorks Data Platform и многое другое.

Предстоящие мероприятия (5+)

AIRF Apache AirFlow

Бизнес-Депо

36 000,00 ₽

2-дневный практический курс по Apache AirFlow разработан для специалистов, инженеров данных и архитекторов, отвечающих за настройку и сопровождение потоков данных (Data Flow) в организации и озерах данных под управление Hadoop и AirFlow. Подробрнее о программе курса https://www.bigdataschool.ru/bigdata/data-flow-with-apache-airflow.html

Курс: SPARK2: Анализ данных с Apache Spark

Moscow

54 000,00 ₽

3-дневный практический курс для разработчиков Apache Spark и специалистов Data Scientists , использующих Spark SQL, потоковую обработку Spark Streaming, построение графов Spark GraphX Подробная программа https://www.bigdataschool.ru/bigdata/apache-spark-sql.html

DPREP: Подготовка данных для Data Mining

Бизнес-Депо

72 000,00 ₽

О Курсе: Процесс сбора и подготовки данных — один из самых трудоемких и сложных этапов в анализе больших объемов данных, который порой занимает до 80% всего времени. Использование статистических методик и современного программного обеспечения позволяет значительно сократить временные и финансовые затраты на данном этапе, и повысить эффективность и качество конечных результатов.

DSAV: Анализ данных и визуализация в R

Бизнес-Депо

90 000,00 ₽

Данный курс является необходимым для получения практических навыков работы с R и R-Studio. В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных. По окончании курса слушатели овладеют основными навыками обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода. Программа курса 1. Основы статистики и простая линейная регрессия Что такое ваши данные Статистические выводы Введение в машинное обучение Простая линейная регрессия Диагностика и трансформация Коэффициент определенности 2. Базовое программирование с R Введение в R. Что такое R? R-Studio, пакеты и рабочая область Основные элементы языка R Типы объектов данных. Локальный импорт / экспорт данных Введение функций и управляющих операторов Углубленное изучение объектов данных Функции. Программирование функций 3. Базовые элементы данных Преобразование данных (Reshape, Split, Combine) Символы. Обработка строк. Даты и временные метки Сбор Веб-данных API источники данных Подключение к внешней базе данных 4. Манипулирование данными с помощью «dplyr» Подмножество, преобразование и переупорядочение наборов данных Объединение наборов данных Групповые операции над наборами данных 5. Графика данных и визуализация данных Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2 Построение графиков больших данных с ggplot2 6. Расширенная визуализация в R Настраиваемая графика с помощью ggplot2 Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты Интерактивная визуализация в R. Подробнее https://www.bigdataschool.ru/bigdata/data_analytics_and_visualisation_in_r.html

Прошедшие мероприятия (55)

Курс: HIVE: Hadoop SQL Hive администратор

Бизнес-Депо

18 000,00 ₽

Фотографии (52)