Taller sobre extracción de tablas + modelos compilados (¡hubo cambio de tema!)

R-Ladies Santiago
R-Ladies Santiago
Grupo público

El Canelo 2715

El Canelo 2715 · Providencia

Cómo encontrarnos

A tres cuadras del metro Tobalaba

Imagen del lugar del evento

Detalles

[editado el 14 de junio]

El próximo lunes 17 de junio nos volvemos a reunir. En esta ocasión, Ekhos nos recibe en sus oficinas ubicadas muy cerca del metro Tobalaba :)
La sesión estará dividida en dos:

1. En la primera parte, Riva Quiroga (https://twitter.com/rivaquiroga) nos mostrará diversas aproximaciones a la extracción de tablas que están en archivos en pdf. Los paquetes que debes tener instalados para esta parte son {tidyverse}, {tesseract}, {datapasta} y {tabulizer}. Una vez que instales {tesseract}, ejecuta el siguiente código en R para descargar el modelo para español: tesseract::tesseract_download("spa"). Si tu sistema operativo es Linux, debes hacerlo en el terminal (sudo apt install tesseract-ocr-spa).

2. En la segunda parte, Stefanni Cavaletto (https://twitter.com/stefanni_ch) nos mostrará cómo trabajar con modelos compilados (`stacked models`). Los paquetes que debes tener instalados son: {pacman}, {e1071}, {corrplot} y {tidyverse}. Los datos que utilizaremos puedes descargarlos desde este enlace: https://www.dropbox.com/s/atpb1ga9ecql2uq/karan-churn.xlsx?dl=0

Si tienes dudas sobre si todo quedó bien instalado en tu computador, te sugerimos llegar 15 minutos antes para que veamos cómo resolverlo.

Si es la primera vez que asistes a uno de nuestros eventos, recuerda revisar nuestro código de conducta. Es requisito para asistir estar de acuerdo con él: https://github.com/rladies/starter-kit/wiki/Code-of-Conduct#spanish

¡Te esperamos!