Bonjours à tous,
J'ai une petite série de question !!!!!
le but est de faire un moteur de recherche assez important (bien sur pas un géant mais un moyen)
il aurait au moins un serveur dédié !!
Voila j'ai fait un parseur Html et css etc...
maintenant j'arrive a avoir assez de données pour me lancer dans l'indexation :
J'ai le contenu de la page (cache)
je retrouve les morceaux de phrases et son nombre d'occurence
idem pour tous les mots
je sais quand le texte est en gras et quand il l'est pas
l'ensemble des liens ( en local ) qu'il y a dans la page !
je peux tout sortir maintenant et je voulais savoir comment faire pour le mettre dans une base de données !
J'ai choisi Mysql 5.0 ( je travail dessus depuis toujours)
Mes questions :
Pour faire une requete le plus rapidement possible comment faut t-il faire ?
est ce qu'il vaut mieux faire plusieurs tables ? plusieurs base de données ?
pour la structure des tables je pensais faire :
Code :
- table mot
- id_du_site // int(11)
- mot_phrases // text
- nb_occurence_du_mot // int(5)
|
le problémé c'est que j'ai l'impression que je vais avoir des millions d'enregistrement dans cette table car pour un seul site je peux avoir des centaines de mots facilement
faut il faire plusieurs table ( en les classant par ordre alphabétique ? ) et faire une nouvelle table uniquement pour les morceaux de phrases !?
Code :
- table cache
- id_du_site // int(11)
- cache_sans_balise // text
- poids_page // int(5)un
|
est ce la méthode la plus rapide pour faire des recherches par la suite ?
avez vous des conseils ou des articles intéressant qui en parlent ?
Encore merci
N'hésitez pas a laisser tout vos commentaires