Retour à l'accueil - Logo CRISCO

Centre de recherches inter-langues sur la signification en contexte · CRISCO · EA4255

Accueil > Le DES > Présentation du DES > Espace sémantique


Espace sémantique

Qu’appelle t-on l’espace sémantique d’un mot ?

L’espace sémantique d’un mot tel que nous le concevons au CRISCO est une représentation graphique 2D ou 3D des synonymes (et des cliques mais nous y reviendrons) de ce mot. Il permet ainsi rapidement de se rendre compte des différents sens du mot saisi, autrement dit d’apprécier sa polysémie. Comment cela est-il possible ? En fait comme expliqué sur la page de présentation du DES, le DES est composé une grande base de donnée de mots (plus de 49000) et de relations synonymiques 2 à 2 (environ 204000). A partir de cette base et en utilisant les principes de la théorie des graphes, nous pouvons représenter les mots sous forme de sommets et les liens synonymiques sous forme d’arêtes. Prenons l’exemple de baie, un extrait des relations synonymiques dans la base de données pour baie donne :


baie - calanque baie - crique
 baie - fenêtre  baie - fruit
 baie - golfe  baie - grain
 baie - lucarne  baie - ouverture
 baie - échancrure  grain - fruit
 crique – golfe  crique – calanque
 golfe – échancrure  échancrure – ouverture
 ouverture – fenêtre  ouverture – lucarne
 fenêtre - lucarne  

Sous forme de graphe simplifié cela donne :

GrapheBaie

De la nous pouvons extraire des sous-graphes, chacun étant composé d’un ensemble, le plus grand possible, de sommets tous reliés deux à deux. Ces sous-graphes sont appelés des cliques. Dans notre exemple, nous avons cinq cliques :

  • c1 : (grain, fruit,baie),
  • c2 : (échancrure, golfe, baie),
  • c3 : (échancrure, ouverture, baie),
  • c4 : (golfe, crique, calanque, baie) et
  • c5 : (ouverture, fenêtre, lucarne, baie).


Il n’y a pas de clique (échancrure, golfe, ouverture, baie) car il n’y a pas de liaison entre golfe et ouverture. Les cliques aident donc à dissocier les différents sens du mot. Ceci dit, une liste de cliques, surtout quand elle devient conséquente, ne permet pas facilement d’apercevoir ces différents sens. La solution est d’effectuer des transformations mathématiques afin de représenter de manière géométrique l’espace sémantique. Tout comme nous représentons dans un espace orthonormé (u,v), le point A de coordonnés (2,0) et le point B de coordonnées (1,3) sous la forme d’une matrice :

MatriceExemple1

Nous pouvons représenter l’appartenance ou pas d’un mot à une clique par le chiffre 1 ou 0 dans une matrice :

matriceBaie

Les cliques sont des points d’un espace multidimensionnel et les synonymes sont les vecteurs unitaires de cet espace.
Cette matrice ainsi présentée ne nous permet pas de déduire des informations : ces "0" et "1" sur des dizaines de lignes et de colonnes ne peuvent tout bonnement pas être traités par nos cerveaux.
Il est donc indispensable d'effectuer une réduction de dimension afin d'en extraire des informations pertinentes. A titre d'exemple, cette image ci-dessous issue du site RichieNg nous permet de comprendre une réduction de dimension de 3D à 2D.

ReductionDimension3D2DExemple.png

Tous les points en 3D vont être projetés "au mieux" avec le moins de déformation possible sur un plan (en rouge sur le schéma ci-dessus). A chaque point représenté par les coordonnés dans l'espace 3D (x1,x2,x3) va correspondre des coordonnés dans l'espace (z1,z2). Bien sûr, cet exemple est simpliste (puisque nous pouvons en 3D déduire directement ces informations) mais il permet d'imaginer le processus mis en oeuvre lorsque le nombre de dimension est supérieur à 3 et impossible à représenter graphiquement.

Revenons à notre matrice du mot vedette baie : pour obtenir une représentation visible en 2D de ce nuage de points, nous effectuons une analyse en composantes principales (ACP) c’est-à-dire une réduction de dimensions tout en préservant le maximum d’informations afin d’obtenir à l’instar de l’exemple donné. Il est essentiel de conserver une dispersion maximale des points suffisamment explicite pour pouvoir l’interpréter.

Nous obtenons donc pour baie l’espace sémantique suivant :

EspSemBaie2

Cet espace sémantique facilite la compréhension des différents sens de baie : un premier autour de fruit et graine, un second qui porte sur fenêtre et ouverture et enfin un troisième sur abri et anse avec une liaison (échancrure) entre ces 2 derniers sens.


Sources :
 Cahier du CRISCO n°17
 Ploux S., Victorri B.(1998), Construction d’espaces sémantiques à l’aide de dictionnaires de synonymes



Un aperçu en 3D : Le mot TERRE

Espace sémantique TERRE sur le site vimeo

Espace sémantique TERRE sur le site sketchfab

 

Mode d’emploi : quelques touches essentielles

Une fois la page téléchargée, l’image de la vidéo s’affiche. Par défaut, le mode "static pose" est actif. Pour exécuter l’animation, choisir "Take 01" dans le menu déroulant qui s’affiche en cliquant sur la flèche à coté de "static pose".

Quelque que soit l’un de ces 2 modes choisi, il est possible de déplacer l’axe de vue en déplaçant la souris tout en maintenant son bouton gauche appuyé.

Pour revenir à la position de départ, cliquer sur " ?", help puis sur "reset camera view".

La molette de la souris permet de faire des zooms avant/arrière.

 


Télécharger la page

Dernière modification : 30 octobre 2019



Université de Caen Normandie
Laboratoire CRISCO
Esplanade de la Paix | CS 14032 | 14032 Caen cedex 5