R para Humanidades - sesión 2: de PDF a texto plano
Detalles
Este jueves 15 de julio es el segundo episodio de nuestra serie de talleres sobre R para Humanidades que organizaremos de forma colaborativa los capítulos de RLadies de Ciudad de México, Santiago, Valparaíso, Concepción y Talca. La sesión estará a cargo de Silvia Gutiérrez (https://twitter.com/espejolento) y Riva Quiroga (https://twitter.com/rivaquiroga)
Esta vez nos reuniremos para aprender sobre procesamiento de archivos en pdf. Específicamente, veremos como extraer y limpiar datos en documentos de este tipo.
- ¿Qué necesito para participar?
Podrás aprovechar mejor este taller si ya tienes un conocimiento básico de R: sabes cómo crear un script, cómo ejecutar el código, cómo instalar paquetes.
Además de una versión reciente de R y RStudio, necesitas tener los siguientes paquetes (todos disponibles en CRAN):
-
tidyverse
-
pdftools
-
tesseract
-
Horario
El evento se realizará a las 11:00 horas de la zona horaria UTC-4. Puedes revisar a qué hora corresponde en tu zona en el siguiente enlace: https://everytimezone.com/s/10c85ce4 -
Código de conducta
Queremos que este sea un espacio de aprendizaje amable y seguro. Al inscribirte en este evento estás aceptando nuestro código de conducta: https://github.com/rladies/starter-kit/wiki/Code-of-Conduct#spanish
El evento se realizará a través de la plataforma Zoom. El día del taller compartiremos la contraseña en los comentarios del evento.