|
Bas de page | |
---|---|
Auteur | Sujet : Génération de mots similaires |
Publicité | Posté le 24-04-2006 à 16:46:13 |
anapajari s/travail/glanding on hfr/gs; | ça te suffit pas ça : http://dev.mysql.com/doc/refman/5. [...] nsion.html |
rufo Pas me confondre avec Lycos! | J'avais mis mysql comme sgbd à titre informatif mais je ne veux pas être dépendant d'un sgbd (de toute manière, je suis en mysql < 4 donc c'est mort). Mon post concerne uniquement l'aspect algorithmie... Message édité par rufo le 24-04-2006 à 17:43:40 |
Taz bisounours-codeur | il sux ton forum joce |
nargy |
rufo Pas me confondre avec Lycos! |
Message édité par rufo le 24-04-2006 à 18:19:21 |
nargy | > Donc, c'est pas probant.
|
rufo Pas me confondre avec Lycos! |
|
nargy | Comparer les lettres trois par trois, avec toutes les combinaisons possibles.
|
rufo Pas me confondre avec Lycos! |
|
Publicité | Posté le 25-04-2006 à 11:52:50 |
nargy | il prends deux chaines en entrée, renvoie un booléen.
|
rufo Pas me confondre avec Lycos! | Ok, j'ai compris. Mais je pense que cet algo est utile pour savoir dans quelle mesure 2 chaînes (distinctes) se ressemblent. Or, dans mon cas, forcément elles se ressemblent puisque ma 2ième chaîne est générée à partir de la première mais ayant subi une petite modif (ajout/suppression/remplacement d'un caractère). Donc, ça va me retourner vrai uniquement pour les chaînes auxquelles j'ai juste fait une premutation de 2 caractères adjacents C'est donc pas ça qu'il me faut (je sais, je suis difficile!:D).
|
nargy | > cf "dans" -> je veux garder "dasn" et virer "dzns" |
nargy | si je te propose trigraphe et levenstein, c'est parceque j'ai lu sur un site universitaire (lequel?) le résumé d'une thèse dans laquelle ils avaient comparé de nombreuses méthodes (dont soundex1&2, metaphone, et d'autres plus exotiques...) pour comparer des chaînes avec des typos, et ces deux méthodes combinées donnaient les meilleurs résultats pour toutes les langues. |
rufo Pas me confondre avec Lycos! |
Message édité par rufo le 25-04-2006 à 12:38:29 |
rufo Pas me confondre avec Lycos! |
Message édité par rufo le 25-04-2006 à 12:46:25 |
nargy | > ex : "calculateur" -> je veux garder aussi "callculateur". Là, ton algo va me le virer. A moins que vu qu'il va trouver certaines permutations, il va me renvoyer vrai?
|
rufo Pas me confondre avec Lycos! |
|
rufo Pas me confondre avec Lycos! | une petite précision pour l'algo du trigraphe : il compare les permutations de 3 lettres du mot1 avec 3 lettres du mot2 en respectant la position, je veux dire par là :
Message édité par rufo le 25-04-2006 à 18:29:04 |
nargy | > je vois : donc pour filtrer, j'applique successivement sur chaque mot généré levenshtein, soundex et trigraphe et je garde le mot s'il obtient 0 à l'une des 3 fonctions.
|
rufo Pas me confondre avec Lycos! | Au fait, levenshtein, je me demande si c'est très utile? Car à part le mot exact, il va toujours renvoyer un nb > 0 donc il va toujours tomber, non?
|
nargy | bah.. levenshtein te permet de pondérer les résultats. Si l'utilisateur ne fait pas une fôte, les résultats corrects apparaissent en haut de liste.
|
nargy | J'ai trouvé ça en fouillant sur wikipedia:
Message édité par nargy le 26-04-2006 à 12:05:41 |
rufo Pas me confondre avec Lycos! | Je suis aussi sur wikipedia Je suis en train de creuser l'ago de viterbi : Message édité par rufo le 26-04-2006 à 12:06:48 |
nargy | viterbi, c'est pour un réseau neuronal, ça s'applique plus dans les domaines de l'audio ou de la vidéo...
Message édité par nargy le 26-04-2006 à 12:27:16 |
nargy | Ah voilà ce dont je te parlais, un module Perl avec trigram+levenshtein:
Message édité par nargy le 26-04-2006 à 12:31:54 |
rufo Pas me confondre avec Lycos! | pourtant, l'exemple donné pour l'algo de viterbi s'approche assez bien de ce que je cherche à faire. |
rufo Pas me confondre avec Lycos! | Pour pouvoir utiliser l'algo de viterbi, il faut connaître la proba d'avoir telle lettre quand on connaît la lettre précédente dnas une langue donnée. J'ai donc fait une petite moulinette qui m'analyse des textes. J'ai analysé 3 textes :
|
nargy | remarque que c'est interessant, mais je trouve que c'est pas vraiment précis. Peut être faudrait-il faire plus de stats avec l'avant dernière lettre.
|
nargy |
rufo Pas me confondre avec Lycos! |
|
nargy | - ha non non c'est pas ça que je voulais dire
|
rufo Pas me confondre avec Lycos! |
|
nargy | > On risquerait d'agglutiner les lettres en prenant les plus fortes probas
|
Publicité | Posté le |
Sujets relatifs | |
---|---|
script qui scan des rep avec html et qui remplace des mots | les développeurs utilisent-ils des outils de génération auto de codes |
[Résolu] Un compteur de mots dans Word | [reglé]sauter une ligne lors de la generation pdf |
Génération d'un mail avec pièce jointe en PHP | Génération d'un chiffre aléatoire à partir d'une loi gaussienne |
cryptage des mots de passe pour oracle | [C++ débutant] Génération d'instances dynamique (?) |
Etendre XDoclet pour la génération du BusinessDelegate | internal error during packaging generation |
Plus de sujets relatifs à : Génération de mots similaires |