Je voudrais pouvoir lire une page html sequentiellement afin d'en faire un fichier texte classique sans certaines balises, de l'analyser et de faire des modifs dessus, puis de regenerer un troisième fichier html replacant les anciennes balises.
Voila, c'est en gros ce dont j'ai besoin, et je voudrais surtout savoir comment m'y prendre pour lire ce type de données structurées..