Data Space Meetup February

Name: Data Space Meetup February
Start: 2025-02-20T17:30:00+02:00
End: 2025-02-20T22:00:00+02:00

Hosted by Space307

Data Space Cyprus

Details

Привет!

Приглашаем на митап, ориентированный на специалистов, работающих с инжинирингом данных, аналитикой и машинным обучением.

Присоединяйтесь к нам в нашем офисе на Кипре или онлайн из любой точки мира.

Мы пришлём подробную инструкцию о том, как нас найти, по почте после регистрации, а для наших онлайн-гостей поделимся ссылкой на трансляцию за час до события на электронную почту, зарегистрированную в meetup.com.

Контакт для связи c организаторами через Telegram: @space307team

Расписание митапа:
17:30 — Сбор гостей в офлайне
18:00 — 18:40 — A/B тесты — 100500 способов все испортить и не понять этого, Виталий Митекин, к.т.н., Lead Data Scientist в Adun Tech (ex-Mindbox.cloud, ex-ПРОФИ)
18:40 — 19:20 — За пределами A/B-тестов: Uplift с Double ML, Михаил Чистяков, Senior Data Scientist в Space307
19:20 — 20:00 — LLM для корректировки аннотаций, Александр Турутин, Senior Data Scientist в Indrive
20:00 — 22:00 — Нетворкинг для гостей в офлайне

Спикеры:

Виталий Митекин, к.т.н., Lead Data Scientist в Adun Tech (ex-Mindbox.cloud, ex-ПРОФИ)

A/B тесты — 100500 способов все испортить и не понять этого
A/B тесты — очень практически значимая и интересная область data science. Но есть нюанс: шанс совершить ошибку при организации A/B тестов невероятно велик, а понять что такой тест не работает или работает некорректно — сложно.
На опыте организации A/B в более чем для 100 коммерческих организаций (A/B как SaaS) Виталий расскажет о проблемах, которые нечасто обсуждают на семинарах: в чем коварство t-теста в реальных ситуациях? Почему совы (кумулятивные метрики в тесте) — не то, чем кажутся? Как отучить аналитиков подглядывать по утрам и есть ли альтернативы у p-value?
Не будем углубляться в теоремы, поэтому доклад будет полезен для Data Science и для Product Owners.

Михаил Чистяков, Senior Data Scientist в Space307

За пределами A/B-тестов: Uplift с Double ML

Как найти именно тех, для кого ваше изменение имеет значение? Uplift-моделирование позволяет выявлять группы, где воздействие оказывает эффект, выходя за рамки возможностей традиционных A/B-тестов. В докладе обсудим применение метода Double Machine Learning для решения этой задачи.

Александр Турутин, Senior Data Scientist в Indrive

LLM для корректировки аннотаций
Доклад будет посвящён использованию больших языковых моделей (LLMs) для корректировки аннотаций с целью повышения качества и точности данных. Мы обсудим такие подходы, как разработка подсказок (prompt engineering) и обучение в контексте (in-context learning), которые помогают уменьшить ошибки и предвзятость в аннотациях. Особое внимание будет уделено изучению примеров подсказок и сравнению моделей.

Data Space Cyprus

Data Space Meetup February

Data Space Cyprus

Details

Related topics

You may also like