n8n, Automatisation et Intégration de PDF via processing AI & call API
Pas d'IA sans DATA et sans Automatisation. Ce talk-démo est plus orienté Automatisation que Data, ...
On explore la solution n8n, outil d'automatisation low-code, au travers d'un cas d'usage concret d'alimentation d'une base de connaissance depuis des informations provenant de fichiers PDF complexes (fiches produits).
Deux approches sont évaluées et comparées :
-
extraction du texte brut du PDF suivi d'un nettoyage et d'une analyse via Open AI pour structurer les données en JSON selon un schéma prédéfini.
-
utilisation d'une API Adobe pour extraire le texte et les tableaux en tant qu'images. Les images sont ensuite analysées par Open AI Vision pour une retranscription textuelle plus précise.
On en profite pour parcourir les fonctionnalités natives de la solution n8n, en décrivant les options possibles utilisables dans un workflow (loop, code, ...) et de l'éventuelle capacité de n8n à servir d'ETL.
Note: Le lien de diffusion LinkedIn s'affichera une fois enregistré au meetup. Ceci est la toute première diffusion d'un événement enregistré préalablement.