Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1712 connectés 

  FORUM HardWare.fr
  Linux et OS Alternatifs
  Codes et scripts

  Probleme avec pdftotext => Transformation de .ps vers .pdf foireuse ?

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Probleme avec pdftotext => Transformation de .ps vers .pdf foireuse ?

n°702283
petoulachi
A fortiori, brigadier chef
Posté le 05-07-2005 à 12:22:39  profilanswer
 

Bonjour à tous,
 
Je dois réaliser un petit script qui scanne un répertoire, et qui pour chaque fichier pdf extrait le texte dans un nouveau fichier. Avant meme de commencer le script, je m'essaie donc à la commande pdftotext (Debian sarge 3.1, pdf en version 1.2 et pdftotext v3.0).
 
Et deja premier soucis, ça ne marche pas vraiment. A la place, je me retrouve avec un fichier dont le contenu ne ressmble pas à grand chose. J'ai essayer de préciser divers encoding (Latin1, UTF-8, ASCII7) mais sans succès, c'est toujours le meme résultat :/
 
Le man ne m'apprends pas grand chose de plus quant à ce problème.
 
Une aide serait la bienvenue ;)
 
EDIT : J'avance sur mon enquete :D
 
Donc : mon pdf est issu d'un fichier ps, converti en pdf avec la commande ps2pdf.  
Visiblement le soucis est là, car avec un fichier pdf existant (un fichier de doc), pdftotext fonctionne à merveille !
 
Il semblerait qu'il y ai un soucis avec la commande ps2pdf. Le fichier pdf crée est bien lisible avec un viewver pdf, mais il devient impossible d'en extraire le texte !  
Un exemple de fichier pdf généré par ps2pdf est visible ici :
http://petoulachi.coldwire.net/datas/test.pdf
 
ps2pdf se servant au final de gs, en appelant la commande  
gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite
peut etre est-ce ma version du pdfwriter qui a un soucis :??:


Message édité par petoulachi le 06-07-2005 à 12:32:22
mood
Publicité
Posté le 05-07-2005 à 12:22:39  profilanswer
 

n°702288
isntit
Posté le 05-07-2005 à 12:44:42  profilanswer
 

pstotext cette commande peut permettre d'afficher le resultat en live dans ta console ;)


Message édité par isntit le 05-07-2005 à 15:15:27
n°702300
petoulachi
A fortiori, brigadier chef
Posté le 05-07-2005 à 13:43:26  profilanswer
 

J'ai pas tout compris à ta phrase là ?
La commande pstotext n'existe pas (ou alors pas sur ma distrib), mais plutot ps2ascii. Et cette commande travaille sur un fichier ps et non pas pdf :??:
 
EDIT : bon t'as édité ta phrase qui devient beaucoup plus claire ;)


Message édité par petoulachi le 05-07-2005 à 15:36:04
n°702356
isntit
Posté le 05-07-2005 à 15:12:26  profilanswer
 

a tiens !
ba chez moi j'utilise la cmd pstotext ( apt-get install pstotext ) pour decoder du pdf en text dans la console ...
apres si ca peut t'aider je ne sais pas ....  
;)

n°702385
petoulachi
A fortiori, brigadier chef
Posté le 05-07-2005 à 15:34:59  profilanswer
 

Je regarde ça merci :)

n°702394
petoulachi
A fortiori, brigadier chef
Posté le 05-07-2005 à 15:43:15  profilanswer
 

Ha bin ça fait pareil (voir pire): non seulement le résultat est illisible mais ma console part en sucette :D
N␊├F␋B⎺│:/␤⎺└␊/⎻⎼␋┼├└▒┼/⎻␍°# ┴┐┌⎽┴┐┌─⎽␤┐─⎽┘␤␍┴┘┐─⎽␍␤°┐┌┘─ ␤⎽␍┐°┌─⎽┤≤ °┐┌─⎽┤°┐┌─⎽┘␍␤° ─┘┐⎽
␉▒⎽␤: ┴┐┌⎽┴┐┌─⎽␤┐─⎽┘␤␍┴┘┐─⎽␍␤°┐┌┘─: ␌⎺└└▒┼␍ ┼⎺├ °⎺┤┼␍
N␊├F␋B⎺│:/␤⎺└␊/⎻⎼␋┼├└▒┼/⎻␍°#

n°702442
isntit
Posté le 05-07-2005 à 17:29:23  profilanswer
 

oulaaa j'ai jamais eut ca !!! meme avec des pdf enorme avec photos ect ... !!! désoler  :/

n°702457
Profil sup​primé
Posté le 05-07-2005 à 18:03:18  answer
 

petoulachi a écrit :

Ha bin ça fait pareil (voir pire): non seulement le résultat est illisible mais ma console part en sucette :D
N␊├F␋B⎺│:/␤⎺└␊/⎻⎼␋┼├└▒┼/⎻␍°# ┴┐┌⎽┴┐┌─⎽␤┐─⎽┘␤␍┴┘┐─⎽␍␤°┐┌┘─ ␤⎽␍┐°┌─⎽┤≤ °┐┌─⎽┤°┐┌─⎽┘␍␤° ─┘┐⎽
␉▒⎽␤: ┴┐┌⎽┴┐┌─⎽␤┐─⎽┘␤␍┴┘┐─⎽␍␤°┐┌┘─: ␌⎺└└▒┼␍ ┼⎺├ °⎺┤┼␍
N␊├F␋B⎺│:/␤⎺└␊/⎻⎼␋┼├└▒┼/⎻␍°#


 
 
juste pour rire, change de console... des fois ca resous des petites choses...

n°702464
petoulachi
A fortiori, brigadier chef
Posté le 05-07-2005 à 18:21:33  profilanswer
 

Changer de console ?
 
Sinon j'avance sur mon enquete :D
 
Donc : mon pdf est issu d'un fichier ps, converti en pdf avec la commande ps2pdf.  
Visiblement le soucis est là, car avec un fichier pdf existant (un fichier de doc), pdftotext fonctionne à merveille !
 
Il semblerait qu'il y ai un soucis avec la commande ps2pdf. Le fichier pdf crée est bien lisible avec un viewver pdf, mais il devient impossible d'en extraire le texte !  
Un exemple de fichier pdf généré par ps2pdf est visible ici :
http://petoulachi.coldwire.net/datas/test.pdf
 
ps2pdf se servant au final de gs, en appelant la commande  
gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite
peut etre est-ce ma version du pdfwriter qui a un soucis :??:

n°702478
isntit
Posté le 05-07-2005 à 18:46:21  profilanswer
 

d'une console type gnome terminal ou kterm a eterm ou mrxvt il y un gouffre

mood
Publicité
Posté le 05-07-2005 à 18:46:21  profilanswer
 

n°702888
petoulachi
A fortiori, brigadier chef
Posté le 06-07-2005 à 09:44:21  profilanswer
 

Oui enfin là apparemment c'est plutot la transformation ps -> pdf qui ne fonctionne pas vraiment !


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Linux et OS Alternatifs
  Codes et scripts

  Probleme avec pdftotext => Transformation de .ps vers .pdf foireuse ?

 

Sujets relatifs
[cpufreqd] probleme de plageProblème Mandrake // Maintenant c'est le clavier....
Problème d'affichage sous linux mandrakeprobleme smtp sur suse
problème au démarrage + editeur texteproblème avec Logrotate
probleme sous apache[MDK 10.1] Problème d'installation d'un pilote...
Debian sarge, probleme vhcs et probleme tout dailleurs 
Plus de sujets relatifs à : Probleme avec pdftotext => Transformation de .ps vers .pdf foireuse ?


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR