Salut à tous!
J'aimerais réaliser un moteur de recherche intrne à mon site moi même... Ca n'est pas le moteur en lui même qui me pose problème mais plutôt la partie indexation...
Tout le contenu de mon site n'est en effet pas dans la base de données, et je voudrais pouvoir indexer toutes les pages sans forcément faire appel aux métas.
Je voudrais pouvoir indexer mon site automatiquement quand j'en ferais la demande.
Pour ça voici la structure des deux tables que je compte créer (je me suis un peu inspiré de PHPDig) :
id_mot
mot
troislettres
poids
id_mot
chemin
contenu
titre
La colonne "troislettres" (c'est twoletters dans phpdig), je pense, sert plutôt à accélerer la requête de recherche...
La colonne contenu contiendrais 50 caractères de la page avant le mot et 50 caractères de la page après le mot.
La colonne titre, le titre de la page.
Pour l'indexation, je compte ouvrir le fichier index.php et rechercher toutes les balises <a href=""> et ouvrir le fichier contenu dans ces balises. Je vire alors toutes les balises html, de ce fichier, les ", les' ' ) caractère spéciaux ect... et je stockes tous les mots de plus de trois lettres.
Pensez vous que le principe est bon? Auriez-vous des sugestions?
Merci!