Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1373 connectés 

  FORUM HardWare.fr
  Hardware - Périphériques
  Scanner

  Scanner pour OCR entre 100 et 150€...

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Scanner pour OCR entre 100 et 150€...

n°168855
_MoebiuS_
Paranoïd Androïd
Posté le 26-04-2005 à 22:53:17  profilanswer
 

Bonjour,
 
Voilà, j'ai pour l'instant un Agfa SnapScan 1212u (un peu ancien, lent et en USB1, résolution 600dpi x 1200dpi). Je fais essentiellement des scans de documents pour archivage et envoi par mail.
J'essaye de faire des OCR avec Adobe Acrobat et ce scanner, j'ai fait des essais à différentes résolutions et c'est toujours dégueulasse (même en augmentant, j'ai parfois des effets bizarres), c'est-à-dire que je me retrouve souvent avec la moitiée d'une phrase qui reste en bitmap, l'aute moitiée en texte mais avec différentes fontes, etc...
Est-ce que c'est le logiciel Acrobat qui est trop juste ?
 
Est-ce que j'ai intérêt à passer à un autre scanner (dans ce cas là, j'ajouterai dans mes utilisations le scan de diapositives) ? Faut-il regarder dans la direction des petits Canon Lid, des plus gros Canon (CS 4200 ou 5200F), des Epson (2480) ?
Est-ce que je dois passer à un autre logiciel d'OCR (comme Omnipage même LE) sachant que mes fichiers de destination seront de toutes façons des PDF ?
 
Merci par avance pour vos réponses.


---------------
The Magic Words are Squeamish Ossifrage.
mood
Publicité
Posté le 26-04-2005 à 22:53:17  profilanswer
 

n°168981
Edgard_123
Ancien combattant
Posté le 27-04-2005 à 11:09:50  profilanswer
 

Moi aussi, ça m'intéresse. J'ai Adobe Acrobat 5 et un vieux scanner BenQ type 640 (résolution optique max de 600x600). pour de l'OCR, il faut au moins scanner à du 300p. Pour un document PDF, il faut scanner avec qualité au moins moyenne, car Adobe utilise des techniques de lissage de police qui dégradent (à mon avis) la limite des caractères et qui les rendent moins lisibles sur documents imprimés. Malgré quelques réglages et essais et erreurs, j'ai le même résultat, insastisfaisant pour moi. Donc, je pense reprendre un scanner moderne rapide en 300p., type Canon Lide 35 ou le 4200F, suivant des test de scanners glanés ça et là. La résolution maximale est sans importance pour mon usage.
Bref, quelqu'un connait un scanner à moins de 150 euro et qui scanne un A4 en 5 sec. en 300p. en 24 bits ??

n°169932
_MoebiuS_
Paranoïd Androïd
Posté le 28-04-2005 à 22:31:15  profilanswer
 

Je viens d'acquérir l'Epson 2480 pour 99€. La qualité des scans et la vitesse ont l'air très très bonnes, mais par contre, j'ai failli sauter au plafond quand il a démarré.
Je ne m'attendais pas à un truc aussi bruyant et strident.
 
J'hésitais auparavant avec le Canon 4200 (40€ de plus), est-ce que j'ai fait un bon choix ?


---------------
The Magic Words are Squeamish Ossifrage.
n°170641
_MoebiuS_
Paranoïd Androïd
Posté le 30-04-2005 à 23:19:19  profilanswer
 

Quel topic à succès :W :W :W


---------------
The Magic Words are Squeamish Ossifrage.
n°170996
stadiste
Posté le 02-05-2005 à 14:04:07  profilanswer
 

j'ai acheté le 4200f sur un coup de poker au moment ou il est sortit. et bin je suis vraiment pas décus. il marche nickel avec omnipage pour l'ocr :)
 
rapide en usb 2.0.
 
son seul probleme reside au niveau du scan de negatif.
 
Mise a prt cela le rendu est tres bon et est tres précis.


Message édité par stadiste le 02-05-2005 à 14:05:56
n°170999
_MoebiuS_
Paranoïd Androïd
Posté le 02-05-2005 à 14:13:07  profilanswer
 

En voyant les essais sur http://www.hardware.fr/articles/552/page1.html on voit que ce Canon est vraiment excellent. Les vitesses de scan ont l'air de se tenir avec l'Epson.
 
Est-ce que sur le tien le scan de négatif est aussi mauvais (en colorimétrie) ? Combien de diapositives peut-on scanner en même temps ?
 
Et est-ce qu'il fait du bruit ?


---------------
The Magic Words are Squeamish Ossifrage.
n°171173
_MoebiuS_
Paranoïd Androïd
Posté le 02-05-2005 à 19:28:44  profilanswer
 

J'ai essayé 4 logiciels : Adobe Acrobat 7, Adobe Paper Capture 3, Scansoft Omnipage 14 pro, Abby Finereader 7.
J'ai fait les essais avec mes docs et chacun des exemples de ces logiciels, en les croisant.
 
Paper Capture est technologiquement complètement dépassé. Acrobat 7 a le défaut que l'on connait (lissage étrange des caractères, etc...).
Omnipage demande des dizaines de confirmations par page, beaucoup de phrases gardent des mots en mode graphique (comme Acrobat), il y a des paragraphes qui deviennent non homogènes (en fontes, taille de fontes, alignement). Ces résultats sont valables sur leurs propres exemples.
 
FineReader : je ne connais que depuis peu et j'ai été très agréablement surpris. Il n'est pas cher (100€ en version pro) et fonctionne super bien. Les paragraphes sont homogènes, l'OCR est rapide, il n'y a pas de confirmations abusives, et le comble : les exemples d'Omnipages sont mieux reconnus avec FineReader !!!! Et les exportations (en PDF 1.2) sont deux foirs plus petites que celle d'Omnipage (en pdf 1.4) alors que les résolutions sont les mêmes.
 
Voilà ! A bon entendeur !


Message édité par _MoebiuS_ le 02-05-2005 à 19:29:25

---------------
The Magic Words are Squeamish Ossifrage.
n°171643
stadiste
Posté le 03-05-2005 à 21:18:22  profilanswer
 

beh en fait, tu peux scanner 4 negatifs, quand au rendu de couleur, tu peux toujours le corriger apres ;)
 
le soft qui est fournis avec le canon est photostudio 5.5


---------------
"Il ne faut jamais sous estimer le caractère prévisible de la bêtise humaine"
n°171778
Edgard_123
Ancien combattant
Posté le 04-05-2005 à 10:19:37  profilanswer
 

Bon, ben, j'ai acheté le 4200F et j'ai scanné un vieux livre (de 1980, sur le jardinage, avec beaucoup d'images, pas de photos) pour voir avec le logiciel fourni (ScanSoft Omnipage pour l'OCR) et presque les mêmes que ceux dont parle Moebius (Omnipage 14, FineReader 7). J'arrive aux mêmes conclusions que lui, sauf que FineReader m'a laissé un sentiment mitigé, point-de-vue qualité reconnaissance avec mise en forme. Alors, j'ai essayé ReadIRIS 10. C'est celui-là que je garde mais pas en automatique (reconnaissance manuelle des cadres). Sinon, le 4200 est assez rapide (10 à 12 sec pour une page A4 300p.).

n°171803
_MoebiuS_
Paranoïd Androïd
Posté le 04-05-2005 à 11:10:46  profilanswer
 

stadiste a écrit :

beh en fait, tu peux scanner 4 negatifs, quand au rendu de couleur, tu peux toujours le corriger apres ;)


 
Et pour les diapositives avec cache, tu peux en faire 4 à la fois aussi ? L'Epson les fait par groupe de 2. C'est vrai que la colorimétrie, on peut toujours la corriger à postériori ;)
 

Edgard_123 a écrit :

Bon, ben, j'ai acheté le 4200F et j'ai scanné un vieux livre (de 1980, sur le jardinage, avec beaucoup d'images, pas de photos) pour voir avec le logiciel fourni (ScanSoft Omnipage pour l'OCR) et presque les mêmes que ceux dont parle Moebius (Omnipage 14, FineReader 7). J'arrive aux mêmes conclusions que lui, sauf que FineReader m'a laissé un sentiment mitigé, point-de-vue qualité reconnaissance avec mise en forme. Alors, j'ai essayé ReadIRIS 10. C'est celui-là que je garde mais pas en automatique (reconnaissance manuelle des cadres). Sinon, le 4200 est assez rapide (10 à 12 sec pour une page A4 300p.).


 
Je vais essayer ton soft ReadIris pour voir. Dans mes comparatifs, FineReader s'en était bien sorti (pour un soft à 120€ par rapport à un Omnipage à 700€...) même avec les mises en page tordue. En particulier, j'ai essayé les exemples livré avec Omnipage sur FineReader et c'est ce dernier qui s'en sortait le mieux (l'exemple le plus flagrant est opsample5_ENG_FRE_GER.tif qui comporte des images en insert, plusieurs colonnes, des titres en rouges et paragraphes en noirs, 3 langues dans le même document allemand-français-anglais, etc...).
 
10-12 secondes en A4 300dpi, c'est en noir & blanc, grayscale ou couleur ?


---------------
The Magic Words are Squeamish Ossifrage.
mood
Publicité
Posté le 04-05-2005 à 11:10:46  profilanswer
 

n°172344
Edgard_123
Ancien combattant
Posté le 05-05-2005 à 18:21:50  profilanswer
 

Bon, j'ai terminé mon scan de bouquin rapidement, bien plus vite qu'avec mon ancien scanner (ACER 640). Pour préciser les choses, les 10-12 secondes, c'est en gris. Comptons le double pour un document couleur [edit : toujours en 300ppi]. Mais au total, depuis la prévisualisation (très très rapide !) jusqu'à la fin de la page placée dans ReadIRIS avec l'orientation et le redressement automatiques activés des pages, il faut compter 50 sec. par page (2xA5 du bouquin pour faire du A4).
Mais l'analyse auto de la page ne me satisfait pas car trop de chipotages ensuite sur le document WORD 97 que j'ai. Je peux envoyer un exemple de mon livre si tu veux et la conversion en fichier DOC. Très bon taux de réussites au total, même avec de petits caractères (+/- 7 points) par rapport à ce que je connais (j'avais déjà beaucoup travaillé avec la version 4 de ABBYY et la version 11 de SCANSOFT).
Bon, ça reste de l'OCR, donc faut se démener grave avec les outils d'édition pour remettre les morceaux ensemble (je scanne par paquets de 6 à 8 pages selon les difficultés d'édition) et corriger ce qui doit l'être.


Message édité par Edgard_123 le 05-05-2005 à 18:27:02
n°180564
Edgard_123
Ancien combattant
Posté le 29-05-2005 à 12:38:47  profilanswer
 

Pour ceux que cela intéressent encore, voici un lien vers des tests de logiciels OCR.
 
http://www.01net.com/article/277943.html?d=origine
 
A+
 


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Hardware - Périphériques
  Scanner

  Scanner pour OCR entre 100 et 150€...

 

Sujets relatifs
logiciel pour scanner?[Avis] Scanner pour journeaux
Non reconnaissance du scanner et problème USBPb branchement scanner
Que choisir entre un scanner Epson 4180 et un Canon 8400scanner qui s'éteint quand on le branche...
achat scannerscanner canon lide 80 photo ou epson 2480 photo
le top du scannermemoriser les parametres d'un scanner hp 4600
Plus de sujets relatifs à : Scanner pour OCR entre 100 et 150€...


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR