Le problème c'est que l'HTML c'est pas nécessairement du XML...
La première étappe consiste donc à convertir l'HTML en XHTML, il y a plusieurs programme qui font ça très bien dont HTML Tidy, après c'est plus très compliqué puisque le XHTML c'est du XML.
Pour la conversion du XHTML en XML, plusieurs solutions, un petit stylesheet XSLT fera la conversion en tout et n'importe quoi, il existe aussi des solutions graphiques comme XML Spy mais faut s'investir un minimum.