R-Ladies / Dplyr
Detalles
• Lo que haremos
El paquete dplyr, es una herramienta alternativa en R que brinda soporte en análsis y depuración de bases de datos. Proporciona herramientas sencillas para las tareas de manipulación de datos más comunes. Está diseñado para trabajar directamente con marcos de datos, con muchas tareas comunes optimizadas al estar escritas en un lenguaje compilado (C ++). Una característica adicional es la capacidad de trabajar directamente con datos almacenados en una base de datos externa. Los beneficios de hacer esto son que los datos se pueden gestionar de forma nativa en una base de datos relacional, las consultas se pueden realizar en esa base de datos y solo se devuelven los resultados de la consulta. Esto resuelve un problema común con R en que todas las operaciones se llevan a cabo en la memoria y, por lo tanto, la cantidad de datos con la que puede trabajar está limitada por la memoria disponible. Las conexiones de la base de datos esencialmente eliminan esa limitación, ya que puede conectarse a una base de datos de muchos cientos de GB, realizar consultas directamente sobre ella y volver a incluir en R solo lo que necesita para el análisis.
¡Las esperamos! 💜
• Lo que hay que traer
Computadora con R Studio instalado.