Skip to content

Аналитика в распределённых системах

Photo of Павел Гниломедов
Hosted By
Павел Г.
Аналитика в распределённых системах

Details

  1. Анатомия идеального кластера (Антон Чевычалов, Arenadata.io)
    В докладе будет рассмотрена структура современного кластера для больших данных:
  • Как он разворачивается, запускается и обслуживается
  • Какие функции выполняют системы управления кластерами, подобные Apache Ambari и Cloudera Manager
  • Какие ограничения они налагают
    Также Антон расскажет о продукте команды Arenadata, который призван вывести процесс управления сложной инфраструктурой Big Data на качественно новый уровень.
  1. Apache Zeppelin и Tinkoff: год вместе (Максим Белоусов, Tinkoff.ru)
  • Почему в банке в качестве платформы для ad-hoc-анализа был выбран именно Apache Zeppelin
  • Чего нам не хватает в Apache Zeppelin
  • Какие доработки мы внесли в проект
  • Как мы видим для себя развитие проекта
  1. Возможности аналитики внутри MPP (массово-параллельной) СУБД на примере Greenplum (Дмитрий Павлов, Arenadata.io)
    Современная устоявшаяся концепция аналитических платформ предписывает выполнять операции с данными там же, где эти самые данные хранятся.
    Как такой подход чувствует себя в среде классических распределённых СУБД в разрезе аналитических задач? PL/Python в MPP (массово-параллельной) СУБД для задач аналитика – миф или реальность? Также в докладе кратко будет рассмотрен проект Apache MADlib.

  2. Три волны эволюции аналитических инструментов (Павел Тиунов, Statsbot.co)

  • Первые инструменты Business Intelligence.
  • Почему на смену большим BI-платформам пришло большое количество микроинструментария.
  • Что происходит сейчас с со стеком аналитических инструментов и как технологии в области хранения и обработки данных его трансформируют.
Photo of Scale-out databases and engines group
Scale-out databases and engines
See more events
Складочная, д. з, стр.1, вход C-D, третий этаж · Moscow