Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales

Résumé : Notre objectif, dans le cadre de cet article, est d'étudier les résultats produits par un système d'analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles - synonymie, antonymie, hyperonymie, méronymie. Le test de substituabilité est le critère clé auquel les lexicologues ont recours pour identifier la plupart des relations de nature paradigmatique entre mots (Cruse 1986 ; Murphy 2003). Un système d'analyse distributionnelle automatique offre précisément la possibilité de mettre en œuvre ce test à grande échelle, sur un large corpus. Il constitue un outil intéressant pour la vérification empirique de ce principe et, de façon plus générale, pour l'étude de ces relations sémantiques en corpus. Nous avons choisi d'aborder cette question en confrontant les résultats du programme d'AD dont nous disposons avec des données issues de ressources lexicales recensant différents types de relations sémantiques (synonymie, antonymie, hyperonymie, méronymie). Cette confrontation montre de forts décalages entre la ressource distributionnelle et ces lexiques. Si une part importante des paires reliées dans les lexiques sont des voisins distributionnels, c'est loin d'être toujours le cas, même quand il s'agit d'unités lexicales fréquentes dans le corpus. Nous essayons de comprendre les raisons de ces décalages en nous appuyant sur les informations que nous fournit l'analyse automatique. Cette étude est menée sur des données en français.
Type de document :
Communication dans un congrès
CMLF 2012, Jul 2012, France. pp.1001 - 1015, 2012
Liste complète des métadonnées

Littérature citée [20 références]  Voir  Masquer  Télécharger

https://hal-univ-tlse2.archives-ouvertes.fr/hal-00926559
Contributeur : François Morlane-Hondère <>
Soumis le : jeudi 9 janvier 2014 - 17:26:03
Dernière modification le : jeudi 11 janvier 2018 - 06:21:17
Document(s) archivé(s) le : jeudi 10 avril 2014 - 12:00:45

Fichier

shsconf_cmlf12_000293.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00926559, version 1

Collections

Citation

François Morlane-Hondère, Cécile Fabre. Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales. CMLF 2012, Jul 2012, France. pp.1001 - 1015, 2012. 〈hal-00926559〉

Partager

Métriques

Consultations de la notice

572

Téléchargements de fichiers

171