J'aurais besoin de trouver une bibliotheque me permettant d'indexer des fichiers pdf, doc et xml.
A partir de la recherche d'un mot, je souhaîterais trouver le nom du fichier et son chemin d'accès.
Une idée?
Merci
Publicité
Posté le 30-05-2005 à 11:23:30
souk
Tourist
Posté le 30-05-2005 à 12:08:16
ben Lucene
bird80
Posté le 30-05-2005 à 12:09:25
lucene avec des pdf, xml, doc?
souk
Tourist
Posté le 30-05-2005 à 12:10:48
pour les PDF et XML, il y a ce qu'il faut, pour les .doc, je ne sais pas, mais a priori oui ca existe aussi
souk
Tourist
Posté le 30-05-2005 à 12:17:33
(url]http://www.textmining.org[/url]
tu peux y trouver des indexer pour PDF et XML et il semblerait qu'il y ait aussi des wrapper autour de POI pour les documents word, mais j'ai pas testé.