Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1128 connectés 

  FORUM HardWare.fr
  Programmation
  Divers

  Lire les données d'1 PDF

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Lire les données d'1 PDF

n°210963
nanebac
Posté le 09-09-2002 à 14:07:43  profilanswer
 

Bonjour, je me demandais s'il était possible de lire le contenu d'un PDF afin de mettre les données soit dans une BDD soit dans une page Word .
Qu'en pensez-vous ?


---------------
http://www.arome.org/
mood
Publicité
Posté le 09-09-2002 à 14:07:43  profilanswer
 

n°210998
JyB
Posté le 09-09-2002 à 14:49:40  profilanswer
 

nanebac a écrit a écrit :

Bonjour, je me demandais s'il était possible de lire le contenu d'un PDF afin de mettre les données soit dans une BDD soit dans une page Word .
Qu'en pensez-vous ?




 
C'est possible. Peut-être un peu sportif pour les PDF protégés mais c'est possible.

n°211001
nanebac
Posté le 09-09-2002 à 14:51:46  profilanswer
 

Et as tu une piste à me donner ? ici ou par mail si tu préfères...  
Merci d'avance.


---------------
http://www.arome.org/
n°211019
JyB
Posté le 09-09-2002 à 14:57:34  profilanswer
 

nanebac a écrit a écrit :

Et as tu une piste à me donner ?




 
-> La spec PDF chez Adobe (gratis, faut juste chercher un peu).
-> le code source d'xpdf.
-> Le code source d'Aladdin Ghostscript.
 
Accessoirement il existe des scripts pdf->ps, pdf->txt et ps->txt sous Unix, je suppose que ça doit exister sous win aussi.
 
Google est ton ami.

n°211022
lorill
Posté le 09-09-2002 à 14:57:41  profilanswer
 

JyB a écrit a écrit :

 
C'est possible. Peut-être un peu sportif pour les PDF protégés mais c'est possible.




 
Même pour les non protégé c'est relativement chaud il me semble. Y'a pas moyen de le parser pour récuperer tout ca facilement. Le format n'a pas de structure pour recuperer une phrase par exemple. Par contre il est documenté, donc il doit y'avoir moyen de recuperer des choses quand même.

n°211035
nanebac
Posté le 09-09-2002 à 15:03:44  profilanswer
 

Super, et merci,
me voilà nourrit pour une piste de recherche.
Bonne continuation.
Marc


---------------
http://www.arome.org/
n°211072
Carbon_14
Posté le 09-09-2002 à 15:20:00  profilanswer
 

Le pb qu'il peut y avoir est quand on met du texte scanné en tant que bitmap dans un PDF. Tintin pour extraire le texte : y en a pas. Faut alors faire de l'OCR sur le fichier image.
 :(  

n°211087
JyB
Posté le 09-09-2002 à 15:22:28  profilanswer
 

carbon_14 a écrit a écrit :

Le pb qu'il peut y avoir est quand on met du texte scanné en tant que bitmap dans un PDF. Tintin pour extraire le texte : y en a pas. Faut alors faire de l'OCR sur le fichier image.
 :(  
 




 
Effectivement, c'est encore le meilleur moyen de protection contre une vampirisation numérique. Mais bon, ce n'est pas la majorité des PDF (malheureusement c'est la majorité des PDF de manuels de matos)

n°211116
nanebac
Posté le 09-09-2002 à 15:32:00  profilanswer
 

Effectivement je n'avais pas pensé à cette possibilité. Mais pour savoir si le doc contient cela je vais devoir déjà regarder ce qu'il y a dedans...


---------------
http://www.arome.org/
n°211163
Carbon_14
Posté le 09-09-2002 à 16:04:57  profilanswer
 

C'est une solution de rapidité (facilité :ange:) quand le manuel existe déjà.
 
Y en a qui vendent des BDD de composants en scannant les Data books. Ca prend une place (numérique :)) folle !! Mais s'il fallait tout redessiner, OCR_iser le texte, remettre en forme, ...

mood
Publicité
Posté le 09-09-2002 à 16:04:57  profilanswer
 

n°211183
deliriumtr​emens
sic transit intestinal...
Posté le 09-09-2002 à 16:22:12  profilanswer
 

carbon_14 a écrit a écrit :

C'est une solution de rapidité (facilité :ange:) quand le manuel existe déjà.
 
Y en a qui vendent des BDD de composants en scannant les Data books. Ca prend une place (numérique :)) folle !! Mais s'il fallait tout redessiner, OCR_iser le texte, remettre en forme, ...




Ouais, mais les manuels sont pas forcément faits à la main par des scribes ou des moines, hein !
 
La source pourrait être éventuellement déjà dans un format informatique quelconque.
 
Et créer des pdf à partir de là, ça me semble pas si compliqué que ça (plutôt que tout scanner).
 
Non ?


Message édité par deliriumtremens le 09-09-2002 à 16:28:39
n°211187
Carbon_14
Posté le 09-09-2002 à 16:27:52  profilanswer
 

Je parle de sociétés indépendantes des fabricants qui "recyclent" les vieilles DOCs faites à une époque où l'informatique était débutante et mystérieuse, gérée par les moines_systèmes :lol:, dans des monastères climatisés :lol:.  
 
Quand c'est le fabricant qui les diffuse, c'est beaucoup plus "léger" car pensé dès le début. Mais cela ne concerne que les circuits électroniques nouveaux, pas les vieux trucs qui figurent sur des grimoires en papier.


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Divers

  Lire les données d'1 PDF

 

Sujets relatifs
recup des données formatées, depuis un fichier dans un flexgrid[Visual Basic] Grille de données
[Access] Copier des données d'une table vers une autreConvertir les données d'une feuille Excel en requête SQL? Spossible?
[ CDDB ] Un script bash permettant de recupérer des données cddb ?[JAVA] Quel soft pour lire un fichier .class ?
cast, conception, compliqué à résumer, venz donc lire ! :Davec kel programme je pe lire du chinois sur winxp fr?
php ou asp ? pour créer une base de donnéescréation base de données asp - sos débutant
Plus de sujets relatifs à : Lire les données d'1 PDF


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR