|
Bas de page | |
---|---|
Auteur | Sujet : Performances champ de type tableau |
Publicité | Posté le 19-02-2011 à 14:26:06 |
rufo Pas me confondre avec Lycos! | Pourquoi c'est pas possible J'ai bien développé un algorithme sémantique basé sur LSA et je me retrouve avec des tables où chacune contient plusieurs millions d'enregistrements. C'est vraiment pas un pb. En plus, la plupart des bons SGBD implémentent la notion de partition, utile dans le cas de très grosses tables...
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm |
|
Publicité | Posté le 22-02-2011 à 12:05:18 |
rufo Pas me confondre avec Lycos! | Pour info, pour mon algo LSA, la table qui contient le tf-idf des termes/documents fait 15 millions de lignes pour 250 Mo. Ca, c'est pour environ 3050 termes et 5000 documents. En comptant les autres tables (temporaires) utiles pour l'algo, la base monte à 1.2 Go, 57 millions d'enregistrements. --------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
rufo Pas me confondre avec Lycos! |
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm |
rufo Pas me confondre avec Lycos! |
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm | L'idée c'est quand même de développer un outil efficace et peu coûteux en ressources... |
rufo Pas me confondre avec Lycos! |
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm | L'indexation sera bien évidemment limité à un modif de domaines |
thibautm | C'est une infinité de fois plus rapide avec des INSERT multiples ! Même si ça mouline encore |
couak | essayes pgloader |
thibautm | si tu as de bon tuto je suis preneur |
rufo Pas me confondre avec Lycos! | +1 je pense que notre ami ne s'y connait pas trop en traitement naturel des langues. Dans son cas, à mon avis, il n'y a aucun intérêt à indexer les "petits mots", le la les sur dans... Et je parie qu'il ne transforme pas en lemmes les termes des documents. D'où pourquoi il va se retrouver avec autant de termes indexés mais qui ne vont lui servir strictement à rien.
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm | (vous pensez réellement que ça ira beaucoup plus vite avec pgloader ?) |
rufo Pas me confondre avec Lycos! | Ben non. A chaque insert, le sgbd doit recalculer l'index. Si tu l'enlèves avant l'import et le remets après, le sgbd va calculer en 1 fois l'index. Ca va donc plus vite... --------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
thibautm | okay ! |
rufo Pas me confondre avec Lycos! | Au fait, t'as pas répondu si, pour améliorer la pertinence des réponses fournies par ton moteur de recherche, tu utilisais la lemnisation des termes et le tf-idf (ou un coefficient ayant la même fonction)?
Message édité par rufo le 24-02-2011 à 16:59:10 --------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
rufo Pas me confondre avec Lycos! |
--------------- Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta |
Publicité | Posté le |
Sujets relatifs | |
---|---|
[RESOLU] | [SSRS] Positionnement dans champ dans Report |
comment ajouter un champ | [PHP] Jointure sur plusieurs champ ? |
[PHP] quelle librairie pour faire des graphes type candlestick? | ViewState de type tableau |
Probleme verification champ formulaire javascript | Tableau excel graphique compliqué ! |
Tableau de relations | |
Plus de sujets relatifs à : Performances champ de type tableau |