Tips and Tricks for News Aggregation: From Crawling to Web Serving


Details
PyData Skopje ве поканува на предавање на тема „Совети и трикови за агрегација на вести: Од пребарување до веб-сервисирање“, кое ќе се одржи на 24.09.2025 година во 18:00 часот во просториите на Base42. Предавањето ќе го одржи д-р Игор Трајковски, основач на [Тime.mk](https://time.mk/)
Оваа сесија е наменета за секој што е заинтересиран за градење системи што собираат, обработуваат, групираат, класифицираат и презентираат содржина на вести во голем обем.
Предавањето ќе го опфати целиот процес на современ систем за агрегација на вести:
- Веб-потрага – стратегии за избор на извори, градење ефикасни пребарувачи и оптимизирање на перформансите.
- Екстракција на текст и слики – чистење на неуреден HTML, ракување со различни формати и извлекување значајни сигнали.
- Кластерирање – групирање на поврзани вести во кохерентни приказни.
- Класификација и рангирање – примена на модели за машинско учење и рангирање за категоризација, приоритизација и оценување на релевантноста.
- Веб-сервисирање – ефикасна инфраструктура за испорака во реално време, кеширање и корисничко искуство.
д-р Игор Трајковски е основач на Time.mk — водечкиот агрегатор на вести во Македонија од 2008 година, кој им служи на стотици илјади корисници со автоматизирани канали за извлекување, семантичка сличност, групирање, рангирање и високо-ефикасна веб-достава.
Д-р Трајковски е искусен научник за податоци и софтверски инженер, со академска и професионална работа во Македонија и Германија. Бил вонреден професор по компјутерски науки (2008–2016) на ФИНКИ, Универзитет „Св. Кирил и Методиј“ во Скопјe.

Tips and Tricks for News Aggregation: From Crawling to Web Serving