Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1516 connectés 

  FORUM HardWare.fr
  Programmation
  Shell/Batch

  Comparaison de PDF

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Comparaison de PDF

n°2073713
4get9
C'est clair !
Posté le 04-05-2011 à 10:52:42  profilanswer
 

Bonjour,
 
Afin de mettre en place un outil de non régression, je désirerai faire des comparaisons courriers générés en PDF
je suis sous unix et j'ai utilisé la commande cmp, en retirant du document (par un grep) la version du document, et la date d'édition. Ces 2 paramètres étant les seuls à pouvoir changer d'une édition à l'autre (sauf si le courrier réellement changé)
Sauf que dans un PDF parfois le texte est stocké en clair dans le fichier, et parfois en binaire (image ?)
du coup j'ai des différences qui ressortent.
 
Connaissez-vous un outil de comparaison de PDF ?
Unix voire Windows ou une solution autre (OCR sur le PDF)  
 
Merci

mood
Publicité
Posté le 04-05-2011 à 10:52:42  profilanswer
 

n°2073908
billgatesa​nonym
Posté le 04-05-2011 à 21:24:58  profilanswer
 

Oui, un texte qui est affiché de manière identique peut être stocké de manière différentes, je le confirme.
Par exemple, le texte peut être compressé (probablement les données binaires que vous voyez) ou pas.
Mais il peut aussi y avoir des informations annexes, telles que la date de création du fichier, son auteur, etc., qui peuvent fausser une comparaison.
 
En conclusion, vous pouvez comparez deux fichiers créés avec les mêmes outils et dans les mêmes circonstances, mais il est quasiment impossible de comparer deux fichiers pouvant être créés dans d'autres cas, à moins d'extraire le texte brut de chaque fichier, grâce à un outil de conversion (je n'en connais pas, mais cela existe peut-être), et ensuite de comparer ce texte brut.

n°2074042
4get9
C'est clair !
Posté le 05-05-2011 à 12:55:49  profilanswer
 

Merci pour cette réponse
Les 2 PDFs sont générés par la même appli (StreamServe)
 
il faudrait que je regarde de plus près si la date de création, la date indiquée sur le courrier, et le numéro de version étaient bien présents en clair AVANT le grep

n°2074276
4get9
C'est clair !
Posté le 06-05-2011 à 11:59:53  profilanswer
 

Bon j'ai trouvé des convertisseurs
 
Tous les soft de comparaison que j'ai trouvé fonctionnent sur le même modèle : convertir en texte puis comparer
 
Pour l'instant ce projet est en stand by pour moi, mais j'ai trouvé xpdf
http://foolabs.com/xpdf/home.html
 
si ça peut en intéresser d'autres...


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Shell/Batch

  Comparaison de PDF

 

Sujets relatifs
Comparaison de deux tables sur deux champsComparaison trois colonnes VBA
Comparaison time heure[Shell] comparaison mot contenu de fichier
Convertir une page web en fichier PDF ou DOC[RESOLU]Requete sql : comparaison chaine
probleme de comparaisonProblème comparaison de date
comparaison de tableauxConversion PDF en SWF : transparent
Plus de sujets relatifs à : Comparaison de PDF


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR