bonjour
je doit realiser un projet en java . c'est un analuser de texte qui applique a des fichier html récuperé sur le web
je doit leur appliqué une grammaire (pour les textes procuderaux ) basée sur la structure et le contenu du texte ;
et cette doit grammaire doit etre indepenndante du code java !
je n'arrive pas a trouver la mailleur approche pour le réaliser ! doit je utliser les parseur, sachant que les fichiers recuperés ne sont pas forcement bien formé ou faire juste un parcours de fichiers texte !! en fait meme pour ces deux methodes j'ai du mal a reconnetre l'approche a avoir!!!
merci de bien vouloir m'aider