next up previous contents index
suivant: Petite note sur le monter: Le douloureux problème du précédent: Le douloureux problème du   Table des matières   Index

Modèles issus de la psychologie

Les travaux en psychologie sur la mémoire et la représentation des connaissances émergèrent dans les années 60, avec les travaux de Collins et Quillian sur les réseaux sémantiques, ceux de Minsky sur les frames et ceux de Sowa sur les graphes conceptuels. L'idée sous-jacente à ces travaux était de développer un modèle du stockage en mémoire de connaissances diverses et variées, connaissances qui pouvaient très bien correspondre au sens d'une phrase. Un exemple de réseau sémantique représentant le sens de la phrase ``Jean aime la belle Marie" est par exemple celui représenté dans la figure 4.6 :

Figure: Réseau sémantique

Les différents éléments de la phrase sont donc associés à des concepts, représentés par des boîtes étiquetées par les mots correspondants, et on exprime par des liens entre ces boîtes les relations sémantiques entre ces concepts.

Utiliser de tels modèles pour représenter le sens d'une phrase suppose que l'on peut retrouver les liens sémantiques d'après les relations syntaxiques entre les mots de la phrase (``Jean" est sujet de ``aimer", donc l'agent du concept, ``belle" qualifie ``Marie", c'est donc une propriété du concept, etc.).

Quoiqu'il en soit, une telle représentation, quelle que soit la façon de l'obtenir à partir d'une phrase, permet ensuite d'effectuer différentes opérations. La traduction est facilitée, puisqu'on dispose d'une abstraction extra-langagière. Il suffit de retrouver la structure grammaticale liée aux différentes relations entre les concepts pour atteindre la structure de la phrase dans la langue voulue. Dans un logiciel de dialogue ou de commande de machine également, les différentes informations présentées peuvent être utilisées par un programme ``classique". Par exemple, un programme simple peut, à partir d'une telle structure, répondre à la question ``Qui aime Marie ?" ou ``Comment est Marie ?", etc.

De tels modèles sont utilisés plus profondément pour représenter un grand nombre de connaissances sur un sujet. Autour de la phrase initiale, par exemple, un réseau sémantique comme celui de la figure 4.7 est envisageable.

Figure: Réseau sémantique

La façon dont se construisent ces réseaux est la suivante. Sont stockés dans la mémoire de l'ordinateur des petits sous-réseaux, centrés chacun sur un concept. Par exemple, le réseau associé à ``aimer" pourrait être celui de la figure 4.8.

Figure: Réseau sémantique du verbe aimer

Une fois défini l'ensemble des sous-réseaux nécessaires à une analyse, il suffit donc de les combiner par des opérations simples, comme un jeu de construction, en respectant des règles de cohérence.

Cependant, il n'est pas envisageable de vouloir ainsi exprimer toutes les connaissances qui peuvent être évoquées par une phrase aussi simple.

Un cas de phénomène linguistique problématique est celui de l'anaphore associative. Par exemple, ``Nous sommes arrivés au village, nous avons rencontré le curé". L'emploi de l'article défini ``le" pour déterminer ``curé" indique que celui-ci est bien repéré dans le récit, donc que ce n'est pas la première fois que l'on en parle. La seule explication est la donnée générale que tout village a un curé, et que dès lors que le village est évoqué, toute une somme d'informations qui s'y rattachent le sont aussi (le maire, le boulanger, la place centrale, etc.).

Des problèmes de nature plus épistémologique se posent à ce stade. Par exemple, les modèles de représentation de la connaissance, puisqu'ils sont issus de la psychologie, manipulent des concepts, et non des entités linguistiques. Un épiphénomène de cet état de chose est la polysémie : un terme donné (unité linguistique), peut couvrir un grand nombre de sens, chacun de ces sens étant un concept. Tout comme un dictionnaire classique précisera diverses entrées pour ``canapé" (au moins deux, pour le meuble et pour l'aliment), le repérage par un système de traitement du sens linguistique du sens de la chaîne de caractères ``canapé" donnera plusieurs possibilités. Pour pallier ce problème, la plupart des systèmes réalisés concernent un domaine de la langue restreint. Il existe par exemple au Canada un bon système de traduction des bulletins météorologiques entre le français et l'anglais, puisque dans ce contexte, d'une part les termes techniques sont légion, donc supportent un sens unique, et que d'autre part les mots polysémique dans l'absolu sont décorrélés de leurs autres sens. Par exemple, ``nuage" n'évoquera pas pour le système le nuage de lait dans une tasse de thé. Et l'inverse serait vrai pour un système traitant des textes liés aux arts de la table.

Mais tout n'est pas si simple, même pour un domaine limité. Si les mots ``pleins" (noms, verbes, adjectifs et adverbes) sont facilement analysables et descriptibles, que dire des conjonctions, prépositions, adverbes de liaison, etc. ? Souvent reconnus comme des mots vides, dénués de sens concret, ou de référent, ils sont généralement purement évacués du système de traitement du sens. Dans le meilleur des cas, ils seront reconnus pour leur rôle syntaxique, et aideront à l'identification de l'arbre syntaxique.

Enfin, il est important de savoir que ces modèles psychologiques sont ici détournés de leur rôle initial. Les réseaux sémantiques, par exemples, servaient à mettre en évidence des phénomènes de proximité entre les concepts mémorisés. Si un individu est chronométré dans ses réponses à des questions comme ``Un canari est-il un oiseau ?", ``Un canari pond-il des oeufs ?", on remarque que les temps diffèrent, et l'hypothèse est donc que les différentes informations sont d'autant plus éloignées dans le réseau sémantique.

Au bout du compte, quel genre de langage est considéré par ces systèmes ? Un langage purement informatif, descriptif, ne remplissant que la fonction référentielle selon Jakobson. Exunt les aspects sociaux du langage, ses aspects esthétiques (figures de style), et le fait que ces aspects sont présents, quel que soit le type de discours, même dans un texte scientifique bien ciblé.


next up previous contents index
suivant: Petite note sur le monter: Le douloureux problème du précédent: Le douloureux problème du   Table des matières   Index
Jerome Cardot 2002-05-27