Data Space Meetup February


Details
Привет!
Приглашаем на митап, ориентированный на специалистов, работающих с инжинирингом данных, аналитикой и машинным обучением.
Присоединяйтесь к нам в нашем офисе на Кипре или онлайн из любой точки мира.
Мы пришлём подробную инструкцию о том, как нас найти, по почте после регистрации, а для наших онлайн-гостей поделимся ссылкой на трансляцию за час до события на электронную почту, зарегистрированную в meetup.com.
Контакт для связи c организаторами через Telegram: @space307team
Расписание митапа:
17:30 — Сбор гостей в офлайне
18:00 — 18:40 — A/B тесты — 100500 способов все испортить и не понять этого, Виталий Митекин, к.т.н., Lead Data Scientist в Adun Tech (ex-Mindbox.cloud, ex-ПРОФИ)
18:40 — 19:20 — За пределами A/B-тестов: Uplift с Double ML, Михаил Чистяков, Senior Data Scientist в Space307
19:20 — 20:00 — LLM для корректировки аннотаций, Александр Турутин, Senior Data Scientist в Indrive
20:00 — 22:00 — Нетворкинг для гостей в офлайне
Спикеры:
- Виталий Митекин, к.т.н., Lead Data Scientist в Adun Tech (ex-Mindbox.cloud, ex-ПРОФИ)
A/B тесты — 100500 способов все испортить и не понять этого
A/B тесты — очень практически значимая и интересная область data science. Но есть нюанс: шанс совершить ошибку при организации A/B тестов невероятно велик, а понять что такой тест не работает или работает некорректно — сложно.
На опыте организации A/B в более чем для 100 коммерческих организаций (A/B как SaaS) Виталий расскажет о проблемах, которые нечасто обсуждают на семинарах: в чем коварство t-теста в реальных ситуациях? Почему совы (кумулятивные метрики в тесте) — не то, чем кажутся? Как отучить аналитиков подглядывать по утрам и есть ли альтернативы у p-value?
Не будем углубляться в теоремы, поэтому доклад будет полезен для Data Science и для Product Owners.
- Михаил Чистяков, Senior Data Scientist в Space307
За пределами A/B-тестов: Uplift с Double ML
Как найти именно тех, для кого ваше изменение имеет значение? Uplift-моделирование позволяет выявлять группы, где воздействие оказывает эффект, выходя за рамки возможностей традиционных A/B-тестов. В докладе обсудим применение метода Double Machine Learning для решения этой задачи.
- Александр Турутин, Senior Data Scientist в Indrive
LLM для корректировки аннотаций
Доклад будет посвящён использованию больших языковых моделей (LLMs) для корректировки аннотаций с целью повышения качества и точности данных. Мы обсудим такие подходы, как разработка подсказок (prompt engineering) и обучение в контексте (in-context learning), которые помогают уменьшить ошибки и предвзятость в аннотациях. Особое внимание будет уделено изучению примеров подсказок и сравнению моделей.

Data Space Meetup February