Bonjour tout le monde,
J'ai une problématique un peu particulière : j'ai un schéma éléctronique en format PDF d'un sous traitant, avec des "objets" (composants élec) sur lesquels on peut avoir des infos en cliquant dessus (genre une résistance : repère topo, valeur, designation etc.).
Sauriez vous comment récupérer ces infos (metadata ?) pour les avoir sous excel (par exemple) pour faire une nomenclature (liste repère topo par feuille, valeurs etc. le tout ranger dans des colonnnes )?
Une moulinette Python, Java ou un truc comme ça (préférence python, c'est le seul truc que j'ai le droit d'install sur mon pc du boulot) ?
J'ai essayé avec Python et la librairie PyPDF2 mais quand je recherche les metadata, ça ne me sort que l'auteur, date de création etc. mais pas du tout ce que je veux.
J'ai essayé pas mal de combinaison pour récup le texte mais là pour le coup, je récupère un infame tas de texte mélangé.
J'admet que la programmation c'est pas mon truc, jusqu'à présent, j'étais plus dans le copié/collé de stackoverflow que dans le "design" pur.
Si quelqu'un a un début d'idée, une solution ou une librairie qui pourrait m'aider...