Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes - Université Toulouse - Jean Jaurès Access content directly
Conference Papers Year : 2013

Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes

Abstract

In this study, we aim to highlight the benefits of using a distributional resource to improve the sorting of the synonyms contained in a dictionary. We compare a distributional resource which was created from a Wikipedia corpus and the Electronic Dictionary of Synonyms of CRISCO. We show that only a part of a given word's synonyms share its contexts in the Wikipedia corpus. We find several explanations for this phenomenon. Then, we compare the dictionary with other distributional resources and we show that the nature of the corpus affects the range of the discrepancy. That means that the nature of the corpus has an influence on the kind of synonyms that appear in the distributional resources. We plan to use this principle for the automatic reorganization of the dictionary's synonyms.
Cette étude vise à mettre en lumière l'intérêt qu'il peut y avoir à se servir d'une ressource générée par analyse distributionnelle automatique pour orienter les résultats fournis par un dictionnaire de synonymes. En croisant une base distributionnelle calculée à partir d'un corpus constitué d'articles de l'encyclopédie Wikipédia et le Dictionnaire Électronique des Synonymes du CRISCO, nous montrons qu'une partie seulement des synonymes proposés pour un mot donné partagent ses contextes d'apparition. Nous mettons au jour plusieurs raisons qui expliquent ce phénomène. Nous montrons ensuite que ce décalage s'observe différemment selon la nature du corpus qui a permis de calculer la base distributionnelle qui sert à filtrer le dictionnaire. Cela signifie que la nature du corpus oriente le type de synonymes filtrés par la base distributionnelle. Nous envisageons d'appliquer ce principe dans un système de réorganisation dynamique des synonymes du dictionnaire du CRISCO.
Fichier principal
Vignette du fichier
semdis-2013-long-001.pdf (285.09 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00926570 , version 1 (09-01-2014)

Identifiers

  • HAL Id : hal-00926570 , version 1

Cite

François Morlane-Hondère. Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes. SemDis 2013, Jun 2013, France. pp.112-125. ⟨hal-00926570⟩
239 View
358 Download

Share

Gmail Facebook Twitter LinkedIn More