Ir para o conteúdo

[MeetUp Online] Word2vec: um gostinho de um algoritmo para PLN

Foto de R-Ladies Lavras
Hosted By
R-Ladies L.
[MeetUp Online] Word2vec: um gostinho de um algoritmo para PLN

Detalhes

Palestrante: Larissa Sayuri Futino Castro dos Santos
https://www.linkedin.com/in/larissa-sayuri-santos/

Mini bio: sou Bacharel em Estatística, mestre e Doutora em Estatística. Já trabalhei com dados de fraudes no SUS e fiz parte de um grupo de estudos de alunos da UFMG com participação voluntária (Stats4Good) em que nos dedicamos a compreender e quantificar a sub-notificação dos crimes de estupro em mulheres no Brasil, chamado GESEM. Hoje eu sou Cientista de Dados na maior plataforma de eventos do Brasil -a Sympla. Desde outubro sou colunista do radar Social Good Brasil. Eu adoro comunicar meus aprendizados (e dores, né?), desmistificando IA e me encantando no meio desse processo.

A primeira vez que eu ouvi falar de word2vec fiquei encantada! Era uma mistura de Matemática com Linguística que parecia uma forma intuitiva de modelar palavras e os seus significados. A ideia é criar um embedding para uma palavra. Ou seja, representá-la como um vetor cuja dimensão é definida pelo usuário. O algoritmo concebe esse vetor aprendendo com os termos que estão em uma janela K de cada termo em análise para que a representação vetorial traduza essa concepção de contexto. E isso tudo é feito com uma rede neural simples! Os algoritmos word2vec foram um divisor de águas da literatura porque permitiram mapear relações sintáticas e semânticas entre palavras. Além da apresentação teórica, vou falar sobre como avaliar a qualidade das embeddings obtidas além de mostrar como fazê-lo - facilmente- no R. Eu tenho certeza que estudar as word embeddings é um jeito muito legal de começar a estudar Processamento de Linguagem Natural!

Inscrições e transmissão via Sympla no link
https://www.sympla.com.br/3-meetup-r-ladies-lavras__872664

Photo of R-Ladies Lavras group
R-Ladies Lavras
Ver mais eventos
Evento online
Este evento já aconteceu