Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes - Université Toulouse - Jean Jaurès Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes

Résumé

In this study, we aim to highlight the benefits of using a distributional resource to improve the sorting of the synonyms contained in a dictionary. We compare a distributional resource which was created from a Wikipedia corpus and the Electronic Dictionary of Synonyms of CRISCO. We show that only a part of a given word's synonyms share its contexts in the Wikipedia corpus. We find several explanations for this phenomenon. Then, we compare the dictionary with other distributional resources and we show that the nature of the corpus affects the range of the discrepancy. That means that the nature of the corpus has an influence on the kind of synonyms that appear in the distributional resources. We plan to use this principle for the automatic reorganization of the dictionary's synonyms.
Cette étude vise à mettre en lumière l'intérêt qu'il peut y avoir à se servir d'une ressource générée par analyse distributionnelle automatique pour orienter les résultats fournis par un dictionnaire de synonymes. En croisant une base distributionnelle calculée à partir d'un corpus constitué d'articles de l'encyclopédie Wikipédia et le Dictionnaire Électronique des Synonymes du CRISCO, nous montrons qu'une partie seulement des synonymes proposés pour un mot donné partagent ses contextes d'apparition. Nous mettons au jour plusieurs raisons qui expliquent ce phénomène. Nous montrons ensuite que ce décalage s'observe différemment selon la nature du corpus qui a permis de calculer la base distributionnelle qui sert à filtrer le dictionnaire. Cela signifie que la nature du corpus oriente le type de synonymes filtrés par la base distributionnelle. Nous envisageons d'appliquer ce principe dans un système de réorganisation dynamique des synonymes du dictionnaire du CRISCO.
Fichier principal
Vignette du fichier
semdis-2013-long-001.pdf (285.09 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00926570 , version 1 (09-01-2014)

Identifiants

  • HAL Id : hal-00926570 , version 1

Citer

François Morlane-Hondère. Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes. SemDis 2013, Jun 2013, France. pp.112-125. ⟨hal-00926570⟩
248 Consultations
394 Téléchargements

Partager

Gmail Facebook X LinkedIn More