Salut,
Je cherche à comprendre comment les moteurs de recherche de bureau indexent les données.
J'ai installé Copernic qui commence évidemment par scanner les fichiers des HD.
Il indexe le nom de fichier, le chemin de fichier, les tags, les auteurs, les contenus... tout cela dans un espace disque relativement faible.
Que fait-il exactement ?
Comment organise-t-il sa base de données ?
Intercepte-t-il les appels vers les fonctions de fichier Windows pour faire l'indexage temps réel ou fait-il autrement ?
Bref, comment ça marche concretement ?
Où puis-je trouver ces infos ?
Je n'ai quasiement rien trouvé sur le net. Ce n'est pas OpenSource mais l'algorithme dans les grandes lignes doit pouvoir être trouvé.
Merci
Guillaume