Аналитика в распределённых системах

Hosted By
Павел Г.

Details
- Анатомия идеального кластера (Антон Чевычалов, Arenadata.io)
В докладе будет рассмотрена структура современного кластера для больших данных:
- Как он разворачивается, запускается и обслуживается
- Какие функции выполняют системы управления кластерами, подобные Apache Ambari и Cloudera Manager
- Какие ограничения они налагают
Также Антон расскажет о продукте команды Arenadata, который призван вывести процесс управления сложной инфраструктурой Big Data на качественно новый уровень.
- Apache Zeppelin и Tinkoff: год вместе (Максим Белоусов, Tinkoff.ru)
- Почему в банке в качестве платформы для ad-hoc-анализа был выбран именно Apache Zeppelin
- Чего нам не хватает в Apache Zeppelin
- Какие доработки мы внесли в проект
- Как мы видим для себя развитие проекта
-
Возможности аналитики внутри MPP (массово-параллельной) СУБД на примере Greenplum (Дмитрий Павлов, Arenadata.io)
Современная устоявшаяся концепция аналитических платформ предписывает выполнять операции с данными там же, где эти самые данные хранятся.
Как такой подход чувствует себя в среде классических распределённых СУБД в разрезе аналитических задач? PL/Python в MPP (массово-параллельной) СУБД для задач аналитика – миф или реальность? Также в докладе кратко будет рассмотрен проект Apache MADlib. -
Три волны эволюции аналитических инструментов (Павел Тиунов, Statsbot.co)
- Первые инструменты Business Intelligence.
- Почему на смену большим BI-платформам пришло большое количество микроинструментария.
- Что происходит сейчас с со стеком аналитических инструментов и как технологии в области хранения и обработки данных его трансформируют.

Scale-out databases and engines
See more events
Складочная, д. з, стр.1, вход C-D, третий этаж · Moscow
Аналитика в распределённых системах