Espace sémantique

Qu’appelle t-on l’espace sémantique d’un mot ?

L’espace sémantique d’un mot tel que nous le concevons au CRISCO est une représentation graphique 2D ou 3D des synonymes (et des cliques mais nous y reviendrons) de ce mot. Il permet ainsi rapidement de se rendre compte des différents sens du mot saisi, autrement dit d’apprécier sa polysémie. Comment cela est-il possible ? En fait comme expliqué dans la présentation du DÉS, le DÉS est composé une grande base de donnée de mots (plus de 49000) et de relations synonymiques 2 à 2 (environ 204000). À partir de cette base et en utilisant les principes de la théorie des graphes, nous pouvons représenter les mots sous forme de sommets et les liens synonymiques sous forme d’arêtes. Prenons l’exemple de baie, un extrait des relations synonymiques dans la base de données pour baie donne :

baie – calanquebaie – crique
 baie – fenêtre baie – fruit
 baie – golfe baie – grain
 baie – lucarne baie – ouverture
 baie – échancrure grain – fruit
 crique – golfe crique – calanque
 golfe – échancrure échancrure – ouverture
 ouverture – fenêtre ouverture – lucarne
 fenêtre – lucarne 
Extrait des relations synonymiques dans la base de données pour baie

Sous forme de graphe simplifié cela donne :

Relations synonymiques du mot baie sous forme de graph
Relations synonymiques du mot baie sous forme de graph

De la nous pouvons extraire des sous-graphes, chacun étant composé d’un ensemble, le plus grand possible, de sommets tous reliés deux à deux. Ces sous-graphes sont appelés des cliques. Dans notre exemple, nous avons cinq cliques :

  • c1 : (grain, fruit,baie),
  • c2 : (échancrure, golfe, baie),
  • c3 : (échancrure, ouverture, baie),
  • c4 : (golfe, crique, calanque, baie) et
  • c5 : (ouverture, fenêtre, lucarne, baie).

Il n’y a pas de clique (échancrure, golfe, ouverture, baie) car il n’y a pas de liaison entre golfe et ouverture. Les cliques aident donc à dissocier les différents sens du mot. Ceci dit, une liste de cliques, surtout quand elle devient conséquente, ne permet pas facilement d’apercevoir ces différents sens. La solution est d’effectuer des transformations mathématiques afin de représenter de manière géométrique l’espace sémantique. Tout comme nous représentons dans un espace orthonormé (u,v), le point A de coordonnés (2,0) et le point B de coordonnées (1,3) sous la forme d’une matrice :

Matrice
Matrice

Nous pouvons représenter l’appartenance ou pas d’un mot à une clique par le chiffre 1 ou 0 dans une matrice :

Matrice du mot Baie
Matrice du mot Baie

Les cliques sont des points d’un espace multidimensionnel et les synonymes sont les vecteurs unitaires de cet espace.
Cette matrice ainsi présentée ne nous permet pas de déduire des informations : ces “0” et “1” sur des dizaines de lignes et de colonnes ne peuvent tout bonnement pas être traités par nos cerveaux.

Il est donc indispensable d’effectuer une réduction de dimension afin d’en extraire des informations pertinentes. A titre d’exemple, cette image ci-dessous issue du site RichieNg nous permet de comprendre une réduction de dimension de 3D à 2D.

Exemple de réduction de dimension de 3D à 2D
Exemple de réduction de dimension de 3D à 2D – @RichieNg

Tous les points en 3D vont être projetés “au mieux” avec le moins de déformation possible sur un plan (en rouge sur le schéma ci-dessus). A chaque point représenté par les coordonnés dans l’espace 3D (x1,x2,x3) va correspondre des coordonnés dans l’espace (z1,z2). Bien sûr, cet exemple est simpliste (puisque nous pouvons en 3D déduire directement ces informations) mais il permet d’imaginer le processus mis en oeuvre lorsque le nombre de dimension est supérieur à 3 et impossible à représenter graphiquement.

Revenons à notre matrice du mot vedette baie : pour obtenir une représentation visible en 2D de ce nuage de points, nous effectuons une analyse en composantes principales (ACP) c’est-à-dire une réduction de dimensions tout en préservant le maximum d’informations afin d’obtenir à l’instar de l’exemple donné. Il est essentiel de conserver une dispersion maximale des points suffisamment explicite pour pouvoir l’interpréter.

Nous obtenons donc pour baie l’espace sémantique suivant :

Espace sémantique du mot baie
Espace sémantique du mot baie

Cet espace sémantique facilite la compréhension des différents sens de baie : un premier autour de fruit et graine, un second qui porte sur fenêtre et ouverture et enfin un troisième sur abri et anse avec une liaison (échancrure) entre ces 2 derniers sens.

Cahier du CRISCO n°17
Ploux S., Victorri B.(1998), Construction d’espaces sémantiques à l’aide de dictionnaires de synonymes

Un aperçu en 3D : Le mot TERRE

Mode d’emploi : quelques touches essentielles

Une fois la page téléchargée, l’image de la vidéo s’affiche. Par défaut, le mode “static pose” est actif. Pour exécuter l’animation, choisir “Take 01” dans le menu déroulant qui s’affiche en cliquant sur la flèche à coté de “static pose”.

Quelque que soit l’un de ces 2 modes choisi, il est possible de déplacer l’axe de vue en déplaçant la souris tout en maintenant son bouton gauche appuyé.

Pour revenir à la position de départ, cliquer sur ” ?”, help puis sur “reset camera view”.

La molette de la souris permet de faire des zooms avant/arrière.