Saltar al contenido

Investigar las tarjetas black con dplyr

Foto de Aleix Ruiz De Villa
Hosted By
Aleix Ruiz De V. y François D.
Investigar las tarjetas black con dplyr

Detalles

dplyr (https://github.com/hadley/dplyr)es es una librería de funciones para analizar y manipular datos: dividir grandes colecciones de datos, aplicar una función a cada parte y re-agrupar las, y también aplicar filtros, ordenar y juntar datos. Es una forma eficaz y elegante de trabajar datos. Por ejemplo:

iris %>% filter(Sepal.Width < 3) %>%
group_by(Species) %>%
summarize(count = n(), mean_length = mean(Petal.Length))

da para todas las flores con sépalos de menos de 3 cm de ancho, agrupadas por especies, el numero de individuos y el tamaño medio de sus pétalos.

http://photos2.meetupstatic.com/photos/event/1/2/0/f/600_436324623.jpeg

Los datos

Trabajaremos sobre los datos de las famosas

"tarjetas black" de Caja Madrid (https://es.wikipedia.org/wiki/Caja_Madrid#Caso_de_las_Tarjetas_.22opacas.22)

En pocas lineas de código podremos investigar en que se gastaron los 15 millones de euros. Veremos que este dinero, que es un poco nuestro, no esta del todo perdido ya que nos permite aprender la estadística de forma divertida. Para instalar este set de datos:

Trae tu laptop!

con versiones recientes de R, Rstudio y con los paquetes dplyr, ggplot2 y devtools instalados, así que el paquete "tarjetasblack" a instalar desde github:

install.packages(c("dplyr", "devtools", "ggplot2"))
devtools::install_github("splatsh/tarjetasblack")
library(tarjetasblack)

François Delaunay

trabaja en los campos de la micro-meteorologia y de la energía eólica desde 2001. Considera los datos meteorológicos como una forma de mirar bajo la falda de madre naturaleza. Para esta afición suele usar R.

Duración: 1h30
Idioma: castellano con acento francés
El texto esta en preparación aquí (https://github.com/fdelaunay/tutorial-dplyr-es/blob/master/R/tutorial-dplyr.md).

Photo of Barcelona R User Group group
Barcelona R User Group
Ver más eventos