Saltar al contenido

Análisis PDF Escaneados con Inteligencia Artificial/Visual LM TODO LOCALMENTE

Foto de gabriel guerrero
Hosted By
gabriel g.
Análisis  PDF Escaneados  con Inteligencia Artificial/Visual LM TODO LOCALMENTE

Detalles

Análisis PDF Escaneados con Inteligencia Artificial/Visual LM TODO LOCALMENTE

Miércoles 07 de mayo 2025

Horario: 7:00pm a 9:30pm

Cuota : 1000 pesos + iva

Duración: 2:30 horas de 7pm a 9:30 pm

Temario

Ejemplos de con cuadernos ya elaborados que se comparten antes del taller

Lectura de documentos PDF Escaneados de aspectos legales como: Fotografías celular de documentos, Contratos con firmas autógrafas, Escrituras, Actas constitutivas y cualquier documento papel escaneado

Lectura de documentos PDF Escaneados complejos con tablas e imágenes para la extracción de sus estructuras: TXT, Tablas e Imagenes

Extracción de oraciones de textos y su almacenamiento en formato JSON

Generación de vectores con embeddings de oraciones de texto
Almacenamiento de vectores en BDVectorial milvus

Uso de Modelos Visuales de Lenguaje (VLM Visual Lenguage Models) en un ambiente LOCAL usando OLLAMA

¿Cuales serian las herramientas básicas que todo desarrollador de INTELIGENCIA ARTIFICIAL debería conocer y manejar?

Herramienta_1. Lenguaje Python

La primera seria conocer un lenguaje de programación. En el mercado del desarrollo existe una gran diversidad, .... pero hoy PYTHON es "el inglés para comunicarse con el mundo"

https://www.python.org/

Lenguaje de programación python

Herramienta_2. Ambiente Anaconda

Para realizar ejemplos de códigos y "ver paso a paso" que sucede con cada ejecución de enunciados Python, debemos instalar un ambiente ANACONDA

https://www.anaconda.com/

Ambiente ANACONDA

Instalación

https://www.anaconda.com/download/success

Instaladores para Windows, Mac, Linux

The world’s most trusted open ecosystem for sourcing, building, and deploying data science and AI initiatives

Administrar ambiente virtual CONDA

Administrar ambiente CONDA

Herramienta_3. Biblioteca IBM docling. Para extracción texto, tablas e imágenes de documentos

Herramienta IBM Extracción de texto, tablas e imágenes

IBM docling para extraccion texto, tablas e imagenes en documentos

Docling parses documents and exports them to the desired format with ease and speed.

## IBM ❤️ Open Source AI

Docling has been brought to you by IBM.

Herramienta_4. Biblioteca de manejo de PDFs. pymupdf4llm

Biblioteca manejo PDF pymupdf4llm

PyMuPDF is a high-performance Python library for data extraction, analysis, conversion & manipulation of PDF (and other) documents.
Herramienta_5. Biblioteca de manejo de Datos con PANDAS

Biblioteca de manejo de datos PANDAS

pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language.

Herramienta_6. Biblioteca de Procesamiento de Lenguaje Natural SpaCy
Procesamiento de Lenguaje (NLP) con SpaCy

Since its release in 2015, spaCy has become an industry standard with a huge ecosystem

  • Components for named entity recognition, part-of-speech tagging, dependency parsing, sentence segmentation, text classification, lemmatization, morphological analysis, entity linking and more

# Industrial-Strength Natural Language Processing

Herramienta_7. Biblioteca de graficación básicas. Matplotlib

https://matplotlib.org/

Biblioteca de visualizacion de datos en python. matplotlib

Herramienta 8. Vectorizadores de textos. BGE_m3,
https://huggingface.co/BAAI/bge-m3

Herramienta 9. Ambiente para ejecucion de LLMs en local OLLAMA

https://ollama.com/

Herramienta 10. Uso de LLM DeepSeek en forma Local

https://ollama.com/library/deepseek-v3

Y otras muchas mas que poco a poco iremos comentando, ...en nuestro curso

Si desea ver videos de uso de estas bibliotecas le recomendamos nuestro canal youtube saxsa, con mas de 350 videos del tema

Canal YouTube saXsa. @saxsabigdata1400

Les invitamos a nuestro próximo curso

Miércoles 07 de mayo 2025

Horario: 7:00pm a 9:30pm
Cuota : 1000 pesos + iva

Atte

Dr Gabriel Guerrero

saxsa2000@gmail.com

Horario: 7pm - 9:30pm

Cuota recuperación: 1,000 pesos + i.v.a.

Si requiere factura, enviar constancia de situación fiscal

Photo of Spark, Ciencia Datos, Inteligencia Artificial y Matemáticas group
Spark, Ciencia Datos, Inteligencia Artificial y Matemáticas
Ver más eventos
GRATIS