Skip to content

Avanzando en la detección del lenguaje ofensivo en español

Photo of Jorge Moreno Blázquez
Hosted By
Jorge Moreno B.
Avanzando en la detección del lenguaje ofensivo en español

Details

SHARE y OffendES_spans: dos nuevos recursos para combatir el lenguaje ofensivo textual.

Durante la charla se presentarán dos recursos lingüísticos recientemente generados que serán clave para avanzar en la investigación del lenguaje ofensivo en español: SHARE y OffendES_spans.

SHARE es un recurso léxico con más de 10.000 términos y expresiones ofensivas por parte de la comunidad de hispanohablantes. Para el desarrollo de este recurso se ha utilizado Fiero, un popular chatbot desarrollado para entablar una conversación con los usuarios y recoger insultos y expresiones a través de la plataforma de mensajería de Telegram. Este vocabulario fue etiquetado manualmente por cinco anotadoras obteniendo un coeficiente kappa del 78,8%.

La generación de SHARE ha permitido liberar el primer corpus en español para el reconocimiento de entidades ofensivas, llamado OffendES_spans, cuya evaluación se ha llevado a cabo a través del desarrollo de uno de los primeros sistemas computacionales en español para la detección de posibles entidades ofensivas incluidas en textos de redes sociales, llegando a obtener un 91% de precisión.

Por último, se mostrará la utilidad del recurso SHARE como herramienta de apoyo a la interpretabilidad del lenguaje ofensivo en los sistemas computacionales.

Paper:[http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.139.pdf](https://www.blogger.com/blog/post/edit/7941808705638184807/6254238249222351133#).

Photo of NLP Spain group
NLP Spain
See more events
Online event
This event has passed