Curso Profesional: Dataductos en R con dplyr


Detalles
Descripción del curso
Una de las labores principales de para correr análisis es preparar datos para que sean adecuados para entrar a la función con la ejecutamos el método, o para visualizarlos. Esto incluye acciones como por ejemplo crear subconjuntos, transformar valores, crear nuevas variables basadas en las que ya tenemos.
Mucho de esto se puede hacer con funciones que son parte del R base. Pero dplyr implementa el concepto de la gramática de datos y permite hacerlo de una forma consistente que es fácil de leer (y por lo tanto más fácil de corregir). Además engancha con todos los demas paquetes del así llamado Tidyverso, para extender las opciones que tenemos para manipular datos usando la misma forma de escribir.
Arrancamos el curso explicando lo beneficios del uso de dplyr. Después lo llevamos a la práctica explicando el concepto de la gramática de datos y los verbos principales, con los cuales practicaremos en grupo. Explicaremos porque Gran parte de la ventaja de dplyr es que se puede aplicar el mismo código en una conección a una base de datos.
En la segunda sección del curso entramos en temas más avanzados. Que pasa por ejemplo si no sabemos de antemano sobre cuales columnas queremos aplicar un select() o un mutate(), y lo queremos incluir como una variable? La respuesta a esas preguntas, y particularmente el uso de dplyr en loops y en funciones, es el tema con el cual cerramos la tarde.
No entramos en los detalles de los demás paquetes relevantes para dataductos con dplyr como por ejemplo tidyr, tibble, spdplyr o simputation. Hay muchos paquetes que adoptaron la forma de hacer cadenas de instrucciones como lo hace dplyr, y la lista sigue creciendo. Tan solo por eso vale la pena tomar un rato para mirar como funciona en más detalle.
Audiencia
Para sacar provecho de este curso es necesario que tengas una base en R. No necesitas ser experto, pero preferiblemente es una herramienta que usas con cierta regularidad. No importa la industria o la rama de la academia en la cual estas trabajando. Lo que se enseña es aplicable para todas las aplicaciones de R.
Sesión Pre-Curso
Si sientes que necesitas refrescar algunos de los conceptos que vamos a tratar en el curso, organizamos un a sesión remota para nivelarnos entre todos. Esta sesión se dará el Miercoles 28 de Febrero de 19:00 a 20:00 en linea (de forma remota). Al registrarte te daremos la información sobre cómo participar.
Tutor
El curso será impartido por Frans van Dunné, un científico de datos con un doctorado en biología de la Universidad de Amsterdam. Como consultor, Frans combina un conjunto diverso de habilidades que incluyen análisis de negocio, análisis de datos y arquitectura empresarial para ayudar a empresas dar una respuesta rápida y efectiva a sus necesidades de innovación. Como profesor Frans ha dictado cursos en universidades y facilitado formación en empresas sobre ciencia de datos, estadísticas multivariables, modelado y simulación.
Programa Curso
08:30 - 09:00 Llegada (café)
09:00 - 09:30 Introducción a Dataductos en R
09:30 - 10:00 Gramática de Datos: hablar en dplyr
10:00 - 10:30 Ejemplos y ejercicios
10:30 - 11:00 Pausa (café & networking)
11:00 - 11:30 Introducción a programación en dplyr
11:30 - 12:30 Usar variables en dataductos dplyr
12:30 - 13:00 Resumen, discusión y Cierre
13:00 - 14:30 Almuerzo y Networking
Inscripción
Participación tiene un costo de CRC 25.000 el cual puede ser pagado a través de Paypal o transferencia bancaria a nombre de ixpantia S.R.L antes del 26 de Febrero. Para mas información sobre los pagos puedes escribir a pagos@ixpantia.com
Organiza
Este evento lo organiza Data Latam en cooperación con ixpantia (https://www.ixpantia.com). Data Latam es una comunidad Latinoamericana de profesionales y académicos aplicando ciencia de datos en su día a día en la industria de datos en Latino América. En sus eventos, cursos y programas de extensión exploramos tecnologías, aprendemos sobre ciencia de datos, hablamos de tendencias y eventos relevantes de la industria, y compartimos novedades del sector.

Curso Profesional: Dataductos en R con dplyr