Skip to content

Curso Profesional: Dataductos en R con dplyr

Photo of Frans van Dunné
Hosted By
Frans van D.
Curso Profesional: Dataductos en R con dplyr

Details

Descripción del curso

Una de las labores principales de para correr análisis es preparar datos para que sean adecuados para entrar a la función con la ejecutamos el método, o para visualizarlos. Esto incluye acciones como por ejemplo crear subconjuntos, transformar valores, crear nuevas variables basadas en las que ya tenemos.

Mucho de esto se puede hacer con funciones que son parte del R base. Pero dplyr implementa el concepto de la gramática de datos y permite hacerlo de una forma consistente que es fácil de leer (y por lo tanto más fácil de corregir). Además engancha con todos los demas paquetes del así llamado Tidyverso, para extender las opciones que tenemos para manipular datos usando la misma forma de escribir.

Arrancamos el curso explicando lo beneficios del uso de dplyr. Después lo llevamos a la práctica explicando el concepto de la gramática de datos y los verbos principales, con los cuales practicaremos en grupo. Explicaremos porque Gran parte de la ventaja de dplyr es que se puede aplicar el mismo código en una conección a una base de datos.

En la segunda sección del curso entramos en temas más avanzados. Que pasa por ejemplo si no sabemos de antemano sobre cuales columnas queremos aplicar un select() o un mutate(), y lo queremos incluir como una variable? La respuesta a esas preguntas, y particularmente el uso de dplyr en loops y en funciones, es el tema con el cual cerramos la tarde.

No entramos en los detalles de los demás paquetes relevantes para dataductos con dplyr como por ejemplo tidyr, tibble, spdplyr o simputation. Hay muchos paquetes que adoptaron la forma de hacer cadenas de instrucciones como lo hace dplyr, y la lista sigue creciendo. Tan solo por eso vale la pena tomar un rato para mirar como funciona en más detalle.

Audiencia

Para sacar provecho de este curso es necesario que tengas una base en R. No necesitas ser experto, pero preferiblemente es una herramienta que usas con cierta regularidad. No importa la industria o la rama de la academia en la cual estas trabajando. Lo que se enseña es aplicable para todas las aplicaciones de R.

Sesión Pre-Curso

Si sientes que necesitas refrescar algunos de los conceptos que vamos a tratar en el curso, organizamos un a sesión remota para nivelarnos entre todos. Esta sesión se dará el Miercoles 28 de Febrero de 19:00 a 20:00 en linea (de forma remota). Al registrarte te daremos la información sobre cómo participar.

Tutor

El curso será impartido por Frans van Dunné, un científico de datos con un doctorado en biología de la Universidad de Amsterdam. Como consultor, Frans combina un conjunto diverso de habilidades que incluyen análisis de negocio, análisis de datos y arquitectura empresarial para ayudar a empresas dar una respuesta rápida y efectiva a sus necesidades de innovación. Como profesor Frans ha dictado cursos en universidades y facilitado formación en empresas sobre ciencia de datos, estadísticas multivariables, modelado y simulación.

Programa Curso

08:30 - 09:00 Llegada (café)

09:00 - 09:30 Introducción a Dataductos en R

09:30 - 10:00 Gramática de Datos: hablar en dplyr

10:00 - 10:30 Ejemplos y ejercicios

10:30 - 11:00 Pausa (café & networking)

11:00 - 11:30 Introducción a programación en dplyr

11:30 - 12:30 Usar variables en dataductos dplyr

12:30 - 13:00 Resumen, discusión y Cierre

13:00 - 14:30 Almuerzo y Networking

Inscripción

Participación tiene un costo de CRC 25.000 el cual puede ser pagado a través de Paypal o transferencia bancaria a nombre de ixpantia S.R.L antes del 26 de Febrero. Para mas información sobre los pagos puedes escribir a pagos@ixpantia.com

Organiza

Este evento lo organiza Data Latam en cooperación con ixpantia (https://www.ixpantia.com). Data Latam es una comunidad Latinoamericana de profesionales y académicos aplicando ciencia de datos en su día a día en la industria de datos en Latino América. En sus eventos, cursos y programas de extensión exploramos tecnologías, aprendemos sobre ciencia de datos, hablamos de tendencias y eventos relevantes de la industria, y compartimos novedades del sector.

Photo of Data Latam Meetup group
Data Latam Meetup
See more events
Creasala Co-working Café
175m este de la rotonda El Farolito Casa 3361 a mano izquierda, Avenida 13 Barrio Escalante · San Jose