Skip to content

WiMLDS Poznań Meetup #5

Photo of Zuzanna Kunik
Hosted By
Zuzanna K. and 3 others
WiMLDS Poznań Meetup #5

Details

PLEASE REGISTER USING GOOGLE FORMS! REGISTRATION LINK: https://goo.gl/forms/hD84TOLNkLBztPJt2

AGENDA:

  1. "Technical debt in machine learning" [ENG] - Jarosław Szymczak*
    *Senior Data Scientist, OLX Group, Berlin

In software development, one of most often underestimated challenges is technical debt. In machine learning systems this adds up with other things to consider. In this talk you will learn about most popular potential pitfalls with real life examples and explanations, such as:

  • handling concept drift
  • being aware of feedback loops
  • living with correction cascades
    and other challenges

Key Words: technical debt, concept drift, correction cascades, feedback loops
Level: 3 [1-5]

  1. "Association Rules in Market Basket Analysis"[ENG]
    Magdalena Górnicka**
    Product Analyst, OLX

association rules, market basket analysis, data mining, search engine

Analiza koszykowa dla historii wyszukiwań użytkowników - identyfikacja synonimów lub produktów często kupowanych razem
Level: 1 [1-5]

  1. "Rozpoznawanie emocji w nagraniach audio przy użyciu spektrogramów i konwolucyjnych sieci neuronowych" [PL]
    Mateusz Półtorak***
    Associate Data Scientist, Pearson

Jedną z najciekawszych form przekazywania bezwarunkowych komunikatów, wykształconą pierwotnie przez wiele gatunków zwierząt, a następnie rozwiniętą przez człowieka, jest ekspresja emocji. Zaliczają się do niej komunikaty niewerbalne, takie jak ruchy mięśni twarzy oraz komunikaty zakodowane w sygnałach dźwiękowych, a dokładniej w mowie.
W dobie coraz głębszej automatyzacji komunikacji między człowiekiem, a komputerem oraz nagłego wysypu systemów wspomagania decyzji, ważną rolę odgrywa zdolność tych systemów do rozpoznawania treści mówionych przez człowieka. Posiadamy aktualnie bardzo wydajne systemy przetwarzające mowę na tekst, jednak procesory przetwarzające sygnały audio, nadal nie są w stanie wydobyć wszystkich informacji z nagrania, a do informacji tych zaliczają się również ludzkie emocje.
Głównym problemem tradycyjnych metod SER (ang. speech emotion recognition), jest zbyt mała odporność na zróżnicowanie zbiorów danych, ich zmienne częstotliwości próbkowania, nierówny stopień zaszumienia, różni mówcy, różne języki, etc. Niska odporność wynika głównie ze zbyt dużego uzależnienia modeli uczenia maszynowego od sposobu w jaki zostaną przygotowane dla nich dane. Jedną z możliwości poradzenia sobie z tym problemem są konwolucyjne sieci neuronowe, będące aktualnie najbardziej wydajną architekturą sztucznych sieci neuronowych w zakresie rozpoznawania obrazów. Jest to spowodowane ich możliwością automatycznej ekstrakcji cech obrazu, gdyż to na jakie cechy będą zwracać uwagę, kształtuje się dopiero podczas uczenia. Dzięki temu sprawdzają się również w analizie spektrogramów, które są wizualną reprezentacją sygnału audio. Spektrogramy zawierają w sobie informacje o natężeniach poszczególnych częstotliwości nagrania w każdej jego próbce, a to w dużej mierze o te trzy składowe (natężenie, częstotliwość, czas) opierały się wszystkie dotychczasowe metody SER. Co więcej - częstotliwości spektrogramu układają się w różnokolorowe wzory, są zatem bardzo dobrym źródłem danych dla CNN, które bez najmniejszego problemu mogą wykrywać kształty w obrazach. Żadna z tradycyjnych metod nie gwarantowała analizy sygnału audio w oparciu o jego "wygląd".

key words: VGG19, emotion, recognition, CNN, spectrogram
level: 4 [1-5]

*********************************************
4. Afterparty! Pizza & networking time, just join us!

Photo of Poznań Women in Machine Learning & Data Science group
Poznań Women in Machine Learning & Data Science
See more events