Up, quelques éléments nouveaux sur notre sujet IA et TAL. Je vais être aussi concis que possible, il s'agit de phraséologie, j'espère que ça réveillera les passions, sinon ce sera toujours ça de pris à titre de note.
1- Le résumé par calcul des déterminants
Exemple de réduction dans le monde numériques :
SOIT une phrase qui décrit la situation suivante : application d'un facteur d'échelle à une scène physique.
On appelle S, la scène physique, et e le facteur d'échelle. Entre crochet un objet spécifique.
La phrase est e X [S].
Dans cette phraséologie on voit qu'on peut aussi bien appliquer à S son déterminant, c'est-à-dire le numérateur de e. Ou bien faire le calcul de e, et l'appliquer à S. Les 2 choses sont équivalentes numériquement mais très différentes phraséologiquement. Bon.
2- Problème de la réduction des déterminants dans la phrases
Le problème de la phraséologie du langage humain est la linéarité, au sens de séquence linéaire. Autrement dit la phraséo-morphologie est celle de la ligne droite, et le sens est livré par séquences juxtaposées. Avec en général une contrainte supplémentaire chronologique, ou temporelle dans le sens des temps de la phrases (une phrase se déroule en plusieurs temps).
Or, le sens, toujours relatif à la réalité physique en dernier ressort, trouve son extension naturelle dans l'espace tri-dimensionnelle, ou dans un espace à un nombre supérieur de dimensions, mais pas moins ... et certainement pas une seule!
La phrase est donc une projection d'un type spécial d'un espace multiple à un espace unidimensionnel. Si l'analyseur sémantique chargé de réduire le matériel d'une phrase (variations sur la syntaxe et les entités grammaticales) tout en conservant le sens résultant de la phrase ( ce qui est un des aspects essentiels du résumé) en venait à s'affranchir de l'opération géométrique spécifiquement humaine de projection linéaire séquentiel du langage, il pourrait certainement rechercher le plus court chemin pour exprimer un sens, et projeter son chemin préféré dans une phrase humaine. On aura là un résumé réellement intelligent.
Mais voyons des illustrations géométriques pour mieux appréhender ce qu'il s'agit concrètement de réaliser.
Un chemin de A vers B est au minimum constitué de la succession de 3 vecteurs, un dans la direction X, un autre dans la direction Y, un autre dans la direction Z, vecteur nul compris. On peut dire que la présence d'un vecteur nul parmi les 3 autres correspond à une expression d'un certaine platitude dans un plan de compréhension donné. A noter immédiatement que l'orientation des axes et plans méritera quelques développement. Pour le moment, sans chercher des notations d'une grande précision, notons XYZ un chemin particulier signifiant AB. ZXY, ou XZY, ou toute autres combinaisons ne modifient pas le sens à moins d'admettre une plus grande individualité des vecteurs et des affinités entre certains d'entre eux, ce qui ne rentre pas en ligne de compte pour l'instant.
Nous obtiendrons une projection spéciale capable de rendre compte de la phraséologie morphologique en décrivant le processus suivant :
a- On prend une ligne L de base muni d'une origine et d'un sens ou plutôt d'un orientateur V, attention à la confusion.
b- Après avoir spécifier syntaxiquement X, Y et Z --> opérateur []; pour former la phrase signifiant AB on pose l'origine de X sur l'origine de L et on couche X sur L suivant V.
c- Puis on amène l'origine de Y sur l'extrémité de X et on couche Y sur L suivant le sens orientateur (sauf palindrome). Même chose pour Z à la suite de Y. On a donc formé une phrase, qui apparaît littéralement comme le cas clinique d'une expression multidimensionnelle.
En résumé en langage humain :
Ce que l'on peut faire
Ce que l'on ne peut pas faire (sauf phrases à double sens), mais que la machine devrait chercher à faire
3-Exploitation plus avant de l'analogie exprimant le déploiement du sens dans une transposition mentale de l'espace réelle (image ci-dessus) : problème de la compréhension.
L'espace que l'on a rapporté à un repère triaxiale X,Y,Z et où est susceptible de se déployer le sens comme relation entre 2 éléments de la réalité, est volontairement moucheté, tacheté et variablement transparent, disons de densité et de composition physique variable. Ce raffinement de la représentation peut nous servir à évoquer le problème de la compréhension. C'est problème est souvent cité dans le contexte du traitement automatique du langage, mais il est délicat de décider s'il constitue ou non une véritable limitation pour la machine. La description qui suit sera utile pour apporter une réponse en terme facilement transposable en algorithme.
Citation :
Faire du sens, trouver une signification à un phénomène, comprendre quelque chose à quelque chose, c'est tracer une succession de vecteurs dans le cube de nos représentations mentales.
|
Les zones d'ombres, nuages opaques à la lumière, voire obstacles solides, réduisent nos possibilités de tracer. Soit ils nous rendent imprécis en tant que supports incohérent à un tracé, ce qui revient au résultat de l'écriture sur du papier mouillé par exemple. Soit que nous soit masqué toute possibilité de tracer, on ne voit pas comment effectuer une jonction ou celle-ci est fondamentalement impossible de la même façon qu'entre 2 feuilles de papiers situées dans 2 pièces différentes, closes, on serait bien en peine de tracer un trait continu. Comment donc la machine saurait-elle trouver elle-même du sens si elle ne comprend pas le monde qui l'entoure, dans le sens qu'elle n'appréhende pas les possibilités physiques?
La question reste ouverte mais je rappelle que j'y ai répondu par la positive en signalant que la machine est elle-même le support et le siège de processus physique, c'est une partie du monde. Un machine exerçant des computations est plus que cela, elle sait tester des lois du monde. Prendre acte de la réussite ou de l'échec d'une certaines quantité de tests sur le monde physique devrait permettre à la machine de mettre le pieds à l'étrier de la connaissance, de la compréhension du monde. De plus les machines programmées par l'homme sont dotées de connaissances importées. Représentation interne et connaissances importées constituent de croire à la capacité des machines computationnelles à accéder l'exploration du sens.
Message édité par cappa le 17-01-2009 à 21:52:40