Bonjour à tous,
Je vous explique ma problématique en VBA sous EXCEL :
J'ai un répertoire C:\CLIENTS qui contient des sous répertoires du type 1, 2, 9, 32, ,...60000.
Les sous-répertoires portent comme nom un numéro et tous les numéros ne se suivent pas, il y en a qui manquent. Cela part de 1 et cela va jusqu'à 60000.
Donc :
C:\CLIENTS\1
C:\CLIENTS\2
C:\CLIENTS\9
...
C:\CLIENTS\60000
A l'intérieur de ces sous-dossiers, j'ai une voire plusieurs pages HTML qui portent des noms différents à chaque fois, comme par exemple ALBERT DUPONT.html, MAURICE RAVEL.html etc.
Aucune logique dans les noms, c'est aléatoire :
C:\CLIENTS\3\ALBERT DUPONT.html
C:\CLIENTS\29\MAURICE RAVEL.html
...
A l'intérieur de ces pages HTML, il y a du code et notamment des lignes affichant un NOM et PRÉNOM, une société, une adresse, un code postal, une ville, un tel, un fax , un email et une adresse de site web.
Je souhaite créer une macro VBA capable de parcourir chacun des sous-répertoires du dossier parent C:\CLIENTS, et d'extraire dans chaque page HTML les informations qui m'intéressent et qui sont encadrées chaque fois par les mêmes balises, pour me les mettre dans un fichier Excel dans les bonnes colonnes NOM, PRÉNOM, SOCIETE, ADRESSE, CP, VILLE, TEL, FAX, EMAIL, WEB.
Les informations qui m'intéressent sont incluses entre <h1> et </a></dd>.
Je pense que c'est possible, j'ai commencé mais c'est une usine a gaz, la macro est très lente, ça plante souvent et j'ai des infos qui sautent. Bref, c'est la galère.
Une idée car je suis dessus depuis une semaine ?
Merci à vous tous.