What we’re about
Grupo para compartir experiencias, éxitos, mejores prácticas y hacer sinergia en la conjunción de aplicaciones de Apache Spark, uso de Aprendizaje Automatizado (Machine Learning, ML), Inteligencia Artificial con Jupyter, Python, TensorFlow y Keras.
Es un lugar que deseamos convertir en una Catapulta para la Promoción y Uso de la Ciencia de Datos y las Matemáticas.
Bienvenidos todos los entusiastas promotores de estas técnicas del Mundo de la Ciencia de los Grandes Volúmenes de Datos y la Inteligencia Artificial
Upcoming events (4+)
See all- Viernes 03 mayo 8 PM, Alfombra Roja Curso IAGenerativa Aprender Haciendo saXsaNeeds location
Gran inicio Curso IAGenerativa Aprender Haciendo saXsa
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Casos prácticos de Inteligencia Artificial Generativa.
Generación de un SISTEMA DE BÚSQUEDA SEMÁNTICA,
Herramientas: Marco de Trabajo LangChain, biblioteca PyMuPDF, Vectorizador BGE (Beijing General Embedding), Modelo LangChain ParentDocumentRetreiver y otros
Caso real utilizando el Diario Oficial de la Federación D.O.F.
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
PayPal.me/saxsa2000Se envía material de los códigos de cuadernos Python previo al curso
Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com
Hace tiempo entendí la importancia de aprender tratando de poner a prueba siempre en situaciones reales lo aprendido.
En nuestro caso mostraremos los modelos y herramientas de la Inteligencia Artificial utilizando documentos PDF que diariamente ofrece el Gobierno Federal en el sitio del D.O.F
https://www.dof.gob.mx/
Hace tiempo entendí la importancia de aprender de otros que previamente ya recorrieron el camino.
Hoy en las redes especializadas se cuenta con un gran número de expertos que nos comparten sus enseñanzas y ejemplos de Inteligencia Artificial y que por medio de videos cortos en YouTube nos comparten sus enseñanzas.
En nuestro curso les compartiremos los códigos de cuadernos Python, así como una gran lista de videos que ofrecen ejemplos de aplicación con datos reales de los modelos de Inteligencia Artificial
Análisis y Sistema de Búsqueda Semántica con Documentos Jurídicos, en particular usando el D.O.F., Diario Oficial de la Federación.
Temas:
Lectura de PDF Generado de un día del DOF usando el marco de trabajo LangChain y biblioteca PyMuPDFAnálisis Exploratorio de las componente del DOF con la extracción del TEXTO TXT, TABLAS E IMAGENES.
Se analiza cada tabla y genera un archivo CSV y un archivo XLSX con el contenido de la tabla. Se integran todas las tablas en un ZIP por formato CSV y en un ZIP por formato XLSX
Se analiza cada imagen y genera un archivo grafico con el formato de origen de la imagen. Se integran todas las imágenes en un ZIP
Se analiza cada página del DOF y segmenta en pedazos (chunks) utilizando el marco de trabajo LangChain y los Splitters por caracteres
Se selecciona un vectorizador (embeddings) para generar los vectores de los segmentos (chunks)
Se integran todos los vectores de los segmentos en una BDVectorial Chroma
Se realiza un servicio de BUSQUEDA SEMANTICA utilizando los Modelos de LangChain
Se afina el servicio de BUSQUEDA SEMANTICA utilizando el modelo LangChain ParentDocument Retreiver para ofrece busquedas con mayor certidumbre
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a.Hemos grabado un Ciclo de Videos en nuestro canal YouTube saXsa, que les compartimos, en particular los adelantos del curso
Avances ejercicio 1 Curso
(https://youtu.be/iWAVOUlOtR4)
Uso de biblioteca "requests" para extracción automática del PDF del sitioAvances ejercicio 2 Curso
(https://youtu.be/PCEPk3cXRCQ)
Uso de biblioteca PyMuPDF para análisis PDF y extracción TXT, Tablas e Imágenes. Se almacenan las tablas en formato CSV y XLSX
Se genera un ZIP por concepto de todos las partes extraídasAvances ejercicio 3 Curso
Uso de marco de trabajo (framework) LangChain para segmentacion del TXT del documento por páginas.
Enseguida segmentacion de cada TXT de Pagina en pedazos PADRE (Parent Chunks) y Segmentación en cada Pedazo PADRE en pedazos HIJO usando metodo RecursiveCharacterTextSplitter de LangChain
Avances ejercicio 4 Curso
Uso de vectorizador (embedding) BGE M3-Embedding,
Multi-Idiomas, Multi-Funcional, Multi-Granular
Uso de BDVectorial Chroma para almacenar los vectores
Uso del Metodo ParentDocumentRetreiver de LangChain para búsqueda semánticaAvances ejercicio 5 Curso
Creación del servicio de BÚSQUEDA SEMÁNTICA
Canal YouTube saXsa
[https://www.youtube.com/@saxsabigdata1400/videos]
(Canal YouTube saXsa)Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
PayPal.me/saxsa2000Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com
- Viernes 03 mayo 8 PM, Alfombra Roja Curso IAGenerativa Aprender Haciendo saXsaNeeds location
Gran inicio Curso IAGenerativa Aprender Haciendo saXsa
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Casos prácticos
Generación de un SISTEMA DE BÚSQUEDA SEMÁNTICA,
Herramientas: Marco de Trabajo LangChain, biblioteca PyMuPDF, Vectorizador BGE (Beijing General Embedding), Modelo LangChain ParentDocumentRetreiver y otros
Caso real utilizando el Diario Oficial de la Federación D.O.F.
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com
Hace tiempo entendí la importancia de aprender tratando de poner a prueba siempre en situaciones reales lo aprendido.
En nuestro caso mostraremos los modelos y herramientas de la Inteligencia Artificial utilizando documentos PDF que diariamente ofrece el Gobierno Federal en el sitio del D.O.F
https://www.dof.gob.mx/
Hace tiempo entendí la importancia de aprender de otros que previamente ya recorrieron el camino.
Hoy en las redes especializadas se cuenta con un gran número de expertos que nos comparten sus enseñanzas y ejemplos de Inteligencia Artificial y que por medio de videos cortos en YouTube nos comparten sus enseñanzas.
En nuestro curso les compartiremos los códigos de cuadernos Python, así como una gran lista de videos que ofrecen ejemplos de aplicación con datos reales de los modelos de Inteligencia Artificial
Análisis y Sistema de Búsqueda Semántica con Documentos Jurídicos, en particular usando el D.O.F., Diario Oficial de la Federación.
Temas:
Lectura de PDF Generado de un día del DOF usando el marco de trabajo LangChain y biblioteca PyMuPDFAnálisis Exploratorio de las componente del DOF con la extracción del TEXTO TXT, TABLAS E IMAGENES.
Se analiza cada tabla y genera un archivo CSV y un archivo XLSX con el contenido de la tabla. Se integran todas las tablas en un ZIP por formato CSV y en un ZIP por formato XLSX
Se analiza cada imagen y genera un archivo grafico con el formato de origen de la imagen. Se integran todas las imágenes en un ZIP
Se analiza cada página del DOF y segmenta en pedazos (chunks) utilizando el marco de trabajo LangChain y los Splitters por caracteres
Se selecciona un vectorizador (embeddings) para generar los vectores de los segmentos (chunks)
Se integran todos los vectores de los segmentos en una BDVectorial Chroma
Se realiza un servicio de BUSQUEDA SEMANTICA utilizando los Modelos de LangChain
Se afina el servicio de BUSQUEDA SEMANTICA utilizando el modelo LangChain ParentDocument Retreiver para ofrece busquedas con mayor certidumbre
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a.Hemos grabado un Ciclo de Videos en nuestro canal YouTube saXsa, que les compartimos, en particular los adelantos del curso
PlayList de 5 videos de las sesiones que compatiremos con todos el codigo
Inscribanse y les enviamos el ZIP con los cuadernos y PDF de ejecucion de los ejercicios
https://www.youtube.com/playlist?list=PL7y7BluT-I_5pj8294RNPugKCG2o5yJR9
Uso de biblioteca "requests" para extracción automática del PDF del sitio
Uso de biblioteca PyMuPDF para análisis PDF y extracción TXT, Tablas e Imágenes. Se almacenan las tablas en formato CSV y XLSX
Se genera un ZIP por concepto de todos las partes extraídasAvances ejercicio 3 Curso
Uso de marco de trabajo (framework) LangChain para segmentacion del TXT del documento por páginas.
Enseguida segmentacion de cada TXT de Pagina en pedazos PADRE (Parent Chunks) y Segmentación en cada Pedazo PADRE en pedazos HIJO usando metodo RecursiveCharacterTextSplitter de LangChain
PlayList de 5 videos de las sesiones que compatiremos con todos el codigo
Inscribanse y les enviamos el ZIP con los cuadernos y PDF de ejecucion de los ejercicios
https://www.youtube.com/playlist?list=PL7y7BluT-I_5pj8294RNPugKCG2o5yJR9Canal YouTube saXsa
[https://www.youtube.com/@saxsabigdata1400/videos]
(Canal YouTube saXsa)Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
PayPal.me/saxsa2000Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com
- Viernes 03 mayo 8 PM, Alfombra Roja Curso IAGenerativa Aprender Haciendo saXsaNeeds location
Gran inicio Curso IAGenerativa Aprender Haciendo saXsa
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Casos prácticos de Inteligencia Artificial Generativa.
Generación de un SISTEMA DE BÚSQUEDA SEMÁNTICA,
Herramientas: Marco de Trabajo LangChain, biblioteca PyMuPDF, Vectorizador BGE (Beijing General Embedding), Modelo LangChain ParentDocumentRetreiver y otros
Caso real utilizando el Diario Oficial de la Federación D.O.F.
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
PayPal.me/saxsa2000Se envía material de los códigos de cuadernos Python previo al curso
Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com
Hace tiempo entendí la importancia de aprender tratando de poner a prueba siempre en situaciones reales lo aprendido.
En nuestro caso mostraremos los modelos y herramientas de la Inteligencia Artificial utilizando documentos PDF que diariamente ofrece el Gobierno Federal en el sitio del D.O.F
https://www.dof.gob.mx/
Hace tiempo entendí la importancia de aprender de otros que previamente ya recorrieron el camino.
Hoy en las redes especializadas se cuenta con un gran número de expertos que nos comparten sus enseñanzas y ejemplos de Inteligencia Artificial y que por medio de videos cortos en YouTube nos comparten sus enseñanzas.
En nuestro curso les compartiremos los códigos de cuadernos Python, así como una gran lista de videos que ofrecen ejemplos de aplicación con datos reales de los modelos de Inteligencia Artificial
Análisis y Sistema de Búsqueda Semántica con Documentos Jurídicos, en particular usando el D.O.F., Diario Oficial de la Federación.
Temas:
Lectura de PDF Generado de un día del DOF usando el marco de trabajo LangChain y biblioteca PyMuPDFAnálisis Exploratorio de las componente del DOF con la extracción del TEXTO TXT, TABLAS E IMAGENES.
Se analiza cada tabla y genera un archivo CSV y un archivo XLSX con el contenido de la tabla. Se integran todas las tablas en un ZIP por formato CSV y en un ZIP por formato XLSX
Se analiza cada imagen y genera un archivo grafico con el formato de origen de la imagen. Se integran todas las imágenes en un ZIP
Se analiza cada página del DOF y segmenta en pedazos (chunks) utilizando el marco de trabajo LangChain y los Splitters por caracteres
Se selecciona un vectorizador (embeddings) para generar los vectores de los segmentos (chunks)
Se integran todos los vectores de los segmentos en una BDVectorial Chroma
Se realiza un servicio de BUSQUEDA SEMANTICA utilizando los Modelos de LangChain
Se afina el servicio de BUSQUEDA SEMANTICA utilizando el modelo LangChain ParentDocument Retreiver para ofrece busquedas con mayor certidumbre
Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a.Hemos grabado un Ciclo de Videos en nuestro canal YouTube saXsa, que les compartimos, en particular los adelantos del curso
Avances ejercicio 1 Curso
(https://youtu.be/iWAVOUlOtR4)
Uso de biblioteca "requests" para extracción automática del PDF del sitioAvances ejercicio 2 Curso
(https://youtu.be/PCEPk3cXRCQ)
Uso de biblioteca PyMuPDF para análisis PDF y extracción TXT, Tablas e Imágenes. Se almacenan las tablas en formato CSV y XLSX
Se genera un ZIP por concepto de todos las partes extraídasAvances ejercicio 3 Curso
Uso de marco de trabajo (framework) LangChain para segmentacion del TXT del documento por páginas.
Enseguida segmentacion de cada TXT de Pagina en pedazos PADRE (Parent Chunks) y Segmentación en cada Pedazo PADRE en pedazos HIJO usando metodo RecursiveCharacterTextSplitter de LangChain
Avances ejercicio 4 Curso
Uso de vectorizador (embedding) BGE M3-Embedding,
Multi-Idiomas, Multi-Funcional, Multi-Granular
Uso de BDVectorial Chroma para almacenar los vectores
Uso del Metodo ParentDocumentRetreiver de LangChain para búsqueda semánticaAvances ejercicio 5 Curso
Creación del servicio de BÚSQUEDA SEMÁNTICA
Canal YouTube saXsa
[https://www.youtube.com/@saxsabigdata1400/videos]
(Canal YouTube saXsa)Duración Taller: 4 horas en 2 sesiones, 2 horas x sesión
Fecha: Viernes 03 de mayo y Viernes 10 de mayo 2024 , 8pm - 10pm
Cuota recuperación: 1600 pesos + i.v.a. (enviar constancia para factura)A todos aquellos que quieran aportar solidariamente una contribución, lo pueden hacer en Pago PayPal
PayPal.me/saxsa2000Dr. Gabriel Guerrero
saxsa2000 (at) gmail.com