What we're about

Grupo para compartir experiencias, éxitos, mejores prácticas y hacer sinergia en la conjuncion de aplicaciones de Apache Spark, uso de Aprendizaje Automatizado (Machine Learning, ML), Inteligencia Artificial con Jupyter, Python, TensorFlow y Keras.

Es un lugar que deseamos convertir en una Catapulta para la Promocion y Uso de la Ciencia de Datos y las Matemáticas.

Bienvenidos todos los entusiastas promotores de estas técnicas del Mundo de la Ciencia de los Grandes Volumenes de Datos y la Inteligencia Artificial

Upcoming events (5+)

¿El fin de la ilusión Cloudera, Hortonworks, MapR y Pivotal Software?

¿El fin de la ilusión Cloudera, Hortonworks, MapR y Pivotal Software? No se preocupe, mejor ocúpese en capacitarse en código abierto Tom Reilly CEO y Mike Olson sabio fundador de Cloudera, se bajan del Elefante. Las acciones de estas empresas se desplomaron alrededor de 40% y los despidos masivos ya se están anunciando. ver noticias recientes [masked]) Hadoop Struggles and BI Deals: What’s Going On? https://www.datanami.com/2019/06/10/hadoop-struggles-and-bi-deals-whats-going-on/ Todas estas noticias de alerta nos dan señales que la ilusión Hadoop y sus herramientas no serán mas una alternativa en el futuro y es una llamada de atención a todas aquellas compañías que hoy tienen instrumentaciones Cloudera/Hortonworks, MapR y Pivotal Software. Este desplome que hoy se grita en todos los pasillos de eventos BigData, ya tenia años de gestacion, aunque el excesivo marketing y buenos vendedores de esas soluciones lograron vender aun muchas instalaciones del soluciones de estos proveedores. En nuestro meetup de saxsa, desde hace un par de años escribíamos: “Le prometieron un Lago de Datos (Data Lake) y le entregaron un Pantano de Datos (Data swamp), ... nosotros lo convertiremos en Catarata de Datos (Data Fall) Un pantano de datos es un lago de datos deteriorado que es inaccesible para los usuarios previstos o proporciona poco valor, ..., ¿se identifica con esto? Si le vendieron la solución para interactuar con el lago de datos, con herramientas novedosas como Apache Pig, Apache Hive, Hbase, Impala, Map/Reduce Jobs, Cloudera Search, Mahuot y otras que ya para que mencionarlas, ... , lamento desilusionarlo porque va hacia el Pantano de Datos, y tal vez ya se encuentra inmerso y ahora quiere monetizar sus datos, pero no sabe ¿cómo? Pero no se preocupe en cualquiera de las situaciones que se encuentre casi en el Pantano de Datos o desesperado por no saber como generar valor con sus datos que NO SE MUEVEN, HAY SOLUCIÓN, generando una Catarata de Datos (Data Fall) para que como en las cataratas del Niagara en Canadá o Cataratas de Iguazú en Brasil, sus datos generen energía. El curso del agua (datos), en nuestro caso, el flujo o movimiento de los datos, es utilizado para la producción de energía (monetizar sus datos). ¿Cómo? Con una conjunción (sinergia) y equilibrio de 3 fuerzas: 1) Datos en abundancia 2) Herramientas adecuadas como Apache Spark, MongoDB, Jupyter, Python, Kafka, BerkeleyDB, formato Parquet, bibliotecas gráficas como D3.js, Bokeh, DASH, equipos de procesamiento CPUs y GPU utilizando TensorFlow como máquina de cálculo 3) Metodologías adecuadas para la Gobernanza de Datos, Matemáticas, Aprendizaje Automatizado (Machine Learning), Inteligencia Artificial con Redes Neuronales Convolutivas y Redes Neuronales Recurrentes de tipo LSTM, con herramientas como Keras” Así que si esta preocupado, mejor ocúpese en formarse en técnicas con herramientas de código abierto que todos los que han soportado “las grandes tormentas del BigData” utilizan. Todos estas herramientas y otras mas son actualmente utilizadas en las plataformas de la nube de las compañías que hoy están siendo bien aceptadas. Para empezar la construcción de una cascada de datos, empiece por nuestros talleres: Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python Sábado 22 de junio 2019 De 10 am 3 pm INVERSIÓN: 1,500 + i.v.a. Detalles: https://www.meetup.com/saxsaBigDataMexico/events/262182016/ Taller Nivel 1: Ciencia de Datos, Machine Learning en Spark, Jupyter, TensorFlow con Python Miércoles 19 de junio 2019 De 10 am 3 pm INVERSIÓN: 2,500 + i.v.a. Detalles: https://www.meetup.com/saxsaBigDataMexico/events/262256876/ Taller Nivel 1.5: TensorFlow, DeepLearning y manejo de imágenes con CNN (Convolutive Neural Nets) Jueves 20 de junio 2019, De 10 am a 3pm INVERSIÓN: 2,500 + i.v.a. Detalles: https://www.meetup.com/saxsaBigDataMexico/events/262256716/ Dr Gabriel GUERRERO [masked] info cel (55)[masked]

A glimpse of tomorrow. Today skills Data Governance with Spark/TensorFlow/AI

A glimpse of tomorrow. Today skills Data Governance with Python/Jupyter/Machine Learning/Spark/Deep Learning/TensorFlow/Artificial Intelligence Les comparto una excelente conferencia y cursos de nuestros temas: Strata Data Sep 23-26, 2019 New York Detalles: https://conferences.oreilly.com/strata/strata-ny A glimpse of tomorrow. The skills you need today. Data changes fast. Whether it’s building a data infrastructure for AI, moving from on-premise to cloud, or enabling secure real-time streaming analysis, you’ll prepare for what’s coming at saXsa. And you'll get the expert-led guidance on the tools and technologies you need to make your data strategies and projects work today. CURSOS EN NY en INGLES, a solo 2,145 US Dollars All training courses take place 9:00am–5:00pm, Monday, September 23–Tuesday, September 24 Hands-on data science with Python What you'll learn, and how you can apply it Understand the basics of machine learning, feature engineering, anomaly detection, and recommendation engines Explore scikit-learn fundamentals Create machine learning processes with scikit-learn Evaluate and apply machine learning to real-world problems PRICE 2,145 US Dollars Machine learning from scratch in TensorFlow What you'll learn, and how you can apply it Understand machine learning, neural networks, deep learning, and artificial intelligence basic concepts Learn what TensorFlow is and what applications it's good for Create deep learning models for classification and regression using TensorFlow Evaluate the benefits and disadvantages of using TensorFlow over other machine learning software PRICE 2,145 US Dollars SI NO PUEDE ESPERAR HASTA SEPTIEMBRE y desea la semana próxima empezar a capacitarse en estos mismos temas, en español, por expertos mexicanos y con costos en pesos, en tarifas de austeridad republicana y pobreza franciscana, no deje de inscribirse con nosotros en saXsa Labs PROXIMOS CURSOS LA SEMANA QUE ENTRA, con los mismos temas anteriores en 3 talleres independientes de 5 horas cada uno Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python Sábado 22 de junio 2019 De 10 am 3 pm INVERSIÓN: 1,500 + i.v.a. Pregunte por descuentos hasta 25% por asistencia a varios módulos, si el pago completo se realiza 2 días antes del primer evento Detalles: https://www.meetup.com/saxsaBigDataMexico/events/262182016/ Taller Nivel 1: Ciencia de Datos, Machine Learning en Spark, Jupyter, TensorFlow con Python Miércoles 19 de junio 2019 De 10 am 3 pm INVERSIÓN: 2,500 + i.v.a. Pregunte por descuentos hasta 25% por asistencia a varios módulos, si el pago completo se realiza 2 días antes del primer evento Detalles https://www.meetup.com/saxsaBigDataMexico/events/262256876/ Taller Nivel 1.5: TensorFlow, DeepLearning y manejo de imágenes con CNN (Convolutive Neural Nets) Jueves 20 de junio 2019, De 10 am a 3pm INVERSIÓN: 2,500 + i.v.a. Pregunte por descuentos hasta 25% por asistencia a varios módulos, si el pago completo se realiza 2 días antes del primer evento Detalles https://www.meetup.com/saxsaBigDataMexico/events/262256716/ Dr Gabriel GUERRERO [masked] info cel (55)[masked]

Ciencia de Datos, Machine Learning en Spark, Jupyter, TensorFlow con Python

Ciencia de Datos, Machine Learning en Spark, Jupyter, TensorFlow con Python miércoles 19 de junio 2019 De 10 am 3 pm Objetivo Talleres teórico/prácticos, que proporcionan capacidades teóricas, técnicas y prácticas para la gestión, manejo y explotación del Big Data La Ciencia de Datos con Machine Learning para la generación de aplicaciones en 3 ambientes: usando Python en arquitectura Vertical (solo python), Horizontal (Con SparkML) y TensorFlow Se proporciona una máquina virtual, con una instalación básica de las herramientas expuestas en éste, así como lecturas complementarias, que permitan a los participantes llevar a cabo prácticas y ejercicios en pseudo-clúster Big Data INVERSIÓN: 2,500 + i.v.a. Pregunte por descuentos hasta 25% por asistencia a varios módulos, si el pago se realiza 2 dias antes del evento detalles: https://www.meetup.com/saxsaBigDataMexico/events/261656760/ Atentamente Dr Gabriel GUERRERO [masked] info cel (55)[masked] TEMARIO Introduccion a conceptos del Aprendizaje Automatizado (ML Machine Learning) Repaso de bibliotecas Python Numpy y Pandas Uso de bibliotecas de ML en Python con Jupyter Uso de ambiente PySpark, uso de Jupyter con Spark y Python Módulo de Spark ML con Python con algoritmos como: Algoritmo de Regresión Lineal Algoritmo de Regresión Logística Algoritmo de KNN Algoritmo de K-means Uso de ambiente TensorFlow con Python para los mismos algoritmos Regresion Lineal, Logistica, KNN y K-means Showroom de Aplicaciones Productivas Ejecución de aplicaciones del Aprendizaje Automatizado en un ambiente Apache Spark, y manejo herramientas Python, Jupyter, Hadoop y la biblioteca SparkML Le prometieron un Lago de Datos (Data Lake) y le entregaron un Pantano de Datos (Data swamp), ... nosotros lo convertiremos en Catarata de Datos (Data Fall) Un pantano de datos es un lago de datos deteriorado que es inaccesible para los usuarios previstos o proporciona poco valor, ..., ¿se identifica con esto? Si le vendieron la solución para interactuar con el lago de datos, con herramientas novedosas como Apache Pig, Apache Hive y otras que ya para que mencionarlas, ... , lamento desilusionarlo porque va hacia el Pantano de Datos, y tal vez ya se encuentra inmerso y ahora quiere monetizar sus datos, pero no sabe ¿cómo? Pero no se preocupe en cualquiera de las situaciones que se encuentre casi en el Pantano de Datos o desesperado por no saber como generar valor con sus datos que NO SE MUEVEN, HAY SOLUCION, generando una Catarata de Datos (Data Fall) para que como en las cataratas del Niagara en Canada o Cataratas de Iguazú en Brasil, sus datos generen energía. El curso del agua (datos), en nuestro caso, el flujo o movimiento de los datos, es utilizado para la producción de energía (monetizar sus datos). Un enfoque necesario para monetizar sus datos, es la aplicacion de Modelos del Aprendizaje Automatizado En este taller utilizamos Python, Jupyter primero en un equipo y enseguida estos mismos algoritmos utilizando la arquitectura de cómputo distribuido y tolerante a fallas SparkML No se lo pierda Atentamente Dr Gabriel GUERRERO [masked] info cel (55)[masked]

CNN (Convolutive Neural Nets) con TensorFlow, DeepLearning con Python

TensorFlow, DeepLearning y manejo de imágenes con CNN (Convolutive Neural Nets) jueves 20 de junio 2019, De 10 am a 3pm Objetivo Uso de TensorFlow como una maquina de calculo en paralelo aplicado a problemas de clasificacion de imagenes con metodologias de CNN Se proporciona una máquina virtual esta contiene: Linux Centos, Anaconda, Python, Jupyter, TensorFlow, Keras, y lecturas complementarias, que permitan a los participantes llevar a cabo prácticas y ejercicios El participante aprenderá los principales conceptos de IA. Generación de aplicaciones con Redes Neuronales Convolutivas (CNN), TensorFlow y Keras, para reconocer objetos en una imagen, entre otras. Se requiere conocimientos basicos de Python Detalles Inicio de TensorFlow, ¿Por qué?, ¿De donde surge?, ¿En donde se utiliza hoy? ¿Como realizo una aplicacion con TensorFlow? Mi primer cuaderno Jupyter con TensorFlow con Python en ambiente Jupyter Algunos elementos de Inteligencia Artificial y DeepLearning Uso de TensorFlow en CNN en CPU y en GPU Ejemplos: deteccion numeros manuscritos, prediccion numerica de valores, clasificacion de imagenes con TensorFlow y Keras Uso de TensorFlow como maquina de calculo paralelo Demostraciones de aplicaciones productivas con TensorFlow y Keras INVERSIÓN: 2,500 + i.v.a. Pregunte por descuentos hasta 25% por asistencia a varios módulos, si el pago se realiza 2 dias antes del evento detalles: https://www.meetup.com/saxsaBigDataMexico/events/261656760/ Atentamente Dr Gabriel GUERRERO [masked] info cel (55)[masked] ¿Por qué TensorFlow? Hoy en día el uso de algoritmos de Aprendizaje Automatizado (Machine Learning) no esta en duda como una herramienta que tiene aplicaciones en una inmensa diversidad de áreas del conocimiento como Visión por Computadoras (Computer Vision), Reconocimiento del Lenguaje y Voz (Speech recognition), Traducción de Idiomas (Language Translations), y en aspectos de la salud como detección de enfermedades por imagenologia. ¿Cómo ha sido posible esta gran aventura de sinergia del mundo de las matemáticas, tecnología de equipos de informática, algoritmos, sistemas operativos y aplicaciones? Esta gran aventura se debe a la conjunción de varios mundos como: Generación a gran escala de Datos (BigData), Herramientas físicas (hardware) como los CPU con una gran cantidad de núcleos de procesamiento en un mismo equipo (Multi Cores), y mas recientemente el surgimiento de arquitecturas de Cómputo Paralelo Gráfico (GPU Graphic Processing Unit) Algoritmos de Minería de Datos, Aprendizaje Automatizado (Machine Learning), Inteligencia Artificial con un gran soporte de matemáticas y sus mecanismos para la descripción formal de problemas y su planteamiento. En los algoritmos cada día mas, se incorporan conceptos y estructuras matemáticas que durante siglos solo se utilizaban en complejos modelos de astronomía y física. Sin embargo, hoy hablamos de matrices y tensores de forma natural en la Inteligencia Artificial. Herramientas lógicas (software) como el sistema operativo Linux y sus versiones de uso empresarial como Centos y RedHatEnterprise, de lenguajes programación para manejo de colecciones (DataSets) con gran facilidad como Scala, y de lenguajes con una gran facilidad de expresión y una inmensa cantidad de bibliotecas como Python. En el mundo de herramientas lógicas (software), también se cuenta con ambientes amigables para la elaboración y diseño de aplicaciones basadas en un contexto de Web, como Jupyter con sus cuadernos interactivos. Estos aspectos hoy también cuentan con “máquinas lógicas de cálculo en paralelo”, como TensorFlow, que puede pensarse como el equivalente de los precursores como las máquinas de cálculo en la historia. En equipos CPU, TensorFlow utiliza bibliotecas de matrices y vectores característicos en esta plataforma tradicional y en GPU, usa bibliotecas CUDA, que optimiza operaciones matriciales en paralelo.

Photos (525)