
What we’re about
Grupo para compartir experiencias, éxitos, mejores prácticas y hacer sinergia en la conjunción de aplicaciones de Apache Spark, uso de Aprendizaje Automatizado (Machine Learning, ML), Inteligencia Artificial con Jupyter, Python, TensorFlow y Keras.
Es un lugar que deseamos convertir en una Catapulta para la Promoción y Uso de la Ciencia de Datos y las Matemáticas.
Bienvenidos todos los entusiastas promotores de estas técnicas del Mundo de la Ciencia de los Grandes Volúmenes de Datos y la Inteligencia Artificial
Upcoming events (4+)
See all- Análisis PDF Escaneados con Inteligencia Artificial/Visual LM TODO LOCALMENTENeeds location
Análisis PDF Escaneados con Inteligencia Artificial/Visual LM TODO LOCALMENTE
Miércoles 07 de mayo 2025
Horario: 7:00pm a 9:30pm
Cuota : 1000 pesos + iva
Duración: 2:30 horas de 7pm a 9:30 pm
Temario
Ejemplos de con cuadernos ya elaborados que se comparten antes del taller
Lectura de documentos PDF Escaneados de aspectos legales como: Fotografías celular de documentos, Contratos con firmas autógrafas, Escrituras, Actas constitutivas y cualquier documento papel escaneado
Lectura de documentos PDF Escaneados complejos con tablas e imágenes para la extracción de sus estructuras: TXT, Tablas e Imagenes
Extracción de oraciones de textos y su almacenamiento en formato JSON
Generación de vectores con embeddings de oraciones de texto
Almacenamiento de vectores en BDVectorial milvusUso de Modelos Visuales de Lenguaje (VLM Visual Lenguage Models) en un ambiente LOCAL usando OLLAMA
¿Cuales serian las herramientas básicas que todo desarrollador de INTELIGENCIA ARTIFICIAL debería conocer y manejar?
Herramienta_1. Lenguaje Python
La primera seria conocer un lenguaje de programación. En el mercado del desarrollo existe una gran diversidad, .... pero hoy PYTHON es "el inglés para comunicarse con el mundo"
Lenguaje de programación python
Herramienta_2. Ambiente Anaconda
Para realizar ejemplos de códigos y "ver paso a paso" que sucede con cada ejecución de enunciados Python, debemos instalar un ambiente ANACONDA
Instalación
https://www.anaconda.com/download/success
Instaladores para Windows, Mac, Linux
The world’s most trusted open ecosystem for sourcing, building, and deploying data science and AI initiatives
Administrar ambiente virtual CONDA
Herramienta_3. Biblioteca IBM docling. Para extracción texto, tablas e imágenes de documentos
Herramienta IBM Extracción de texto, tablas e imágenes
IBM docling para extraccion texto, tablas e imagenes en documentos
Docling parses documents and exports them to the desired format with ease and speed.
## IBM ❤️ Open Source AI
Docling has been brought to you by IBM.
Herramienta_4. Biblioteca de manejo de PDFs. pymupdf4llm
Biblioteca manejo PDF pymupdf4llm
PyMuPDF is a high-performance Python library for data extraction, analysis, conversion & manipulation of PDF (and other) documents.
Herramienta_5. Biblioteca de manejo de Datos con PANDASBiblioteca de manejo de datos PANDAS
pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language.
Herramienta_6. Biblioteca de Procesamiento de Lenguaje Natural SpaCy
Procesamiento de Lenguaje (NLP) con SpaCySince its release in 2015, spaCy has become an industry standard with a huge ecosystem
- Components for named entity recognition, part-of-speech tagging, dependency parsing, sentence segmentation, text classification, lemmatization, morphological analysis, entity linking and more
# Industrial-Strength Natural Language Processing
Herramienta_7. Biblioteca de graficación básicas. Matplotlib
Biblioteca de visualizacion de datos en python. matplotlib
Herramienta 8. Vectorizadores de textos. BGE_m3,
https://huggingface.co/BAAI/bge-m3Herramienta 9. Ambiente para ejecucion de LLMs en local OLLAMA
Herramienta 10. Uso de LLM DeepSeek en forma Local
https://ollama.com/library/deepseek-v3
Y otras muchas mas que poco a poco iremos comentando, ...en nuestro curso
Si desea ver videos de uso de estas bibliotecas le recomendamos nuestro canal youtube saxsa, con mas de 350 videos del tema
Canal YouTube saXsa. @saxsabigdata1400
Les invitamos a nuestro próximo curso
Miércoles 07 de mayo 2025
Horario: 7:00pm a 9:30pm
Cuota : 1000 pesos + ivaAtte
Dr Gabriel Guerrero
Horario: 7pm - 9:30pm
Cuota recuperación: 1,000 pesos + i.v.a.
Si requiere factura, enviar constancia de situación fiscal