Vu que c'est du HTML tu reçois vraiment des caractères avec diacritiques comme é, à, etc, ou bien tu reçois des entités HTML ?
C'est pas pareil
Si tu reçois les vrais caractères et qu'ils sont pétés c'est que tu ne manipules pas la page avec le bon charset donc ça n'a rien à voir avec la regex, commence déjà par récupérer la page sans la corrompre.
Pour les regex y a encore du boulot avant d'arriver à un truc vu ce que tu as fait, mais on verra au fur et à mesure.
---------------
Topic .Net - C# @ Prog