Skip to content

Szeptemberi meetup

Photo of Zoltan Varju
Hosted By
Zoltan V.
Szeptemberi meetup

Details

A rendezvényt a Black Swan Data támogatja.

Orosz György: A RAG és a táblázatos adatok találkozása
Az előadásban bemutatjuk, hogyan javíthatja a táblázatok felismerését a RAG. Kitérünk arra, miért kulcsfontosságú az adatok megfelelő előkészítése a RAG teljesítményének növeléséhez és egy demot is bemutatunk.

Botos András (fejlesztő, K-Monitor), Juhász Attila (projektgazda, K-Monitor): Korrupciós-közpénzes cikkek automatizált BERT alapú felismerése és címkézése - A K-Monitor sajtóadatbázisának automatizálása

A K-Monitor sajtóadatbázisa (adatbazis.k-monitor.hu) közel 20 éve gyűjti és címkék segítségével teszi kereshetővé a korrupcióval és közpénzekkel foglalkozó cikkeket. Mindeddig önkéntesek tucatjai figyelték a magyar hírportálokat és a módszertannak megfelelő írás esetén a kiválasztottakat különböző címkékkel látták el. 2024-ben egy olyan rendszer építésébe kezdtünk, amely a manuális cikkezést minél több ponton automatizált megoldásokkal segíti. Az első, már használatban lévő verzió:
- az online lapok RSS-éből olvassa be a cikkeket,
- majd a cím és a lead alapján BERT modell segítségével klasszifikálja az adatbázisba módszertanához passzolást,
- automatikusan lement egyes adatokat (megjelenés ideje, url, cikkszöveg),
- megállapítja a cikkszövegben szereplő entitásokat (személyek, intézmények, helyszínek),
- az entitások közül a negatív fényben szereplőket (pl. korrupcióban érintettek) címkézésre ajánlja fel.
A meetup során röviden mesélünk a manuális cikkbevitel során felmerült igényekről, arról, hogy mindeddig hova jutottunk el a fejlesztésben, milyen akadályokba futottunk bele és milyen még nagyobbra törő terveink vannak.

Sajtóadatbázis: https://adatbazis.k-monitor.hu
GitHub kód: https://github.com/k-monitor/sajtoadatbazis-automat/
Wiki: https://github.com/k-monitor/sajtoadatbazis-automat/wiki/

Agod Attila (Head of AI Research, MSCI): LLM-ek a pénzügyben

Photo of Open Natural Language Processing Meetup group
Open Natural Language Processing Meetup
See more events