Saltar al contenido

Taller Práctico: Guía de supervivencia para un #DataScientist - Parte 2

Foto de Grokk KeepCoding
Hosted By
Grokk K.
Taller Práctico: Guía de supervivencia para un #DataScientist - Parte 2

Detalles

Apuntate aquí: https://www.eventbrite.es/e/entradas-taller-practico-guia-de-supervivencia-para-un-datascientist-parte-2-122024886721?aff=meetup

¡Hola KeepCoder!

Junto con nuestros amigos del Grupo Caixa Bank y su comunidad tecnológica y digital, PeopleXperienceHUB traemos este taller práctico que es la Guía de superviviencia definitiva para un Data Scientist.
Esta es la segunda parte! Si quieres ver la primera puedes verla aquí: https://youtu.be/gi7vlNpQPjs

¿Sabías que entre un 40 a un 80% del tiempo que se dedica a un proyecto de ciencia de datos e información, se utiliza en la preparación de estos datos?

En la profesión que hemos elegido, el cold-start puede hacerse cuesta arriba sin los conocimientos que la experiencia aporta, así como el conocimiento de las diferentes herramientas que tenemos a nuestra disposición.

Cuando nos encontramos en un proyecto que implique el manejo de grandes volúmenes de datos, las posibilidades de frustración aumentan proporcionalmente al tamaño de los mismos.

Es aquí donde esta guía te aportará consejos en tu día a día en el tratamiento y preparación de la información. La orientaremos a las tecnologías Oracle+Python+PL/SQL.

¿Qué vamos a ver?

  • Help!!! Mí código no termina, da timeout ¿qué hago?
  • Cuidado con una ETL o ELT desde ~~Python~~, utiliza también lenguajes nativos para la Base de Datos, por ejemplo PL/SQL.
  • ¿Puedo paralelizar mis ejecuciones con Python y Oracle?
  • ¿Cómo organizo mis datos para garantizar la concurrencia y la Agilidad?
  • ¿Qué opciones de normalización a los datos puedo aplicar en unos casos particulares... he de aplicarlos siempre?
  • La torre de Babel de los Metadatos ¿cómo oraganizarlos para mejorar la usabilidad y trazabilidad de la información?

Y recuerda, no es lo mismo realizar un ejercicio con un dataset de 1000 registros que enfrentarse a millones o miles de millones de registros en cientos de tablas y ficheros.

Esperamos que esto os sirva como guía de supervivencia básica en vuestro día a día como Data Scientist.

Además, podrás hacer todas las preguntas que tengas al respecto.

Si quieres saber más sobre nuestro ponente, sigue leyendo.

Pablo Sebastian Pereira Oromí: Analista de Sistemas de Información, su primer ordenador fue una Commodore 64 de 8bits, el más reciente una torre doble CPU Xeon 12c con 64GB + 8 SDD 512GB. L@ Programción + integración de los sistemas + Manejo de los Datos han marcado su vida laboral de los últimos 25 años.

Evento en colaboración con People Xperience Hub | Grupo CaixaBank y KeepCoding

PeopleXperienceHUB es la comunidad digital y tecnológica del Grupo CaixaBank. Formando parte de nuestra comunidad podrás participar en eventos tecnológicos de diferente casuística (webinars, ponencias, hackatones..) y recibirás contenido relevante de tendencias disruptivas. En People Xperience HUB buscamos potenciar el talento transformador.

¿Te interesa? No te lo pienses más y únete nuestra Comunidad.

Photo of KeepCoding group
KeepCoding
Ver más eventos
Online Webinar
Madrid · Madrid