PROJET DE RECHERCHE COLOGNE-NANCY :

COLLOCATIONS

Le principal objectif pratique du projet est l'élaboration d'un dictionnaire des collocations des noms français, innovateur par sa conception lexicographique et ses corpus. L'œuvre informera sur le comportement combinatoire (syntaxe et sémantique) des lemmes analysés. Nos principales ressources informatisées, qui rendent compte d’une vaste gamme de variétés stylistiques, sont des quotidiens (Le Monde, Libération, L'Est Républicain), la base textuelle Frantext (1950-2000) en format ASCII et le Trésor de la langue française. Les outils d'analyse sont le concordancier MonoConc ainsi que les programmes permettant de calculer log likelihood et information mutuelle, des renseignements statistiques sur le degré de spécificité des combinaisons verbales. Inspirée par des modèles lexicographiques anglo-saxons (Dictionary of English Word Combinations, 1997), la notion de collocation sera définie de façon large et comprendra les combinaisons lexicales ainsi que les constructions morphosyntaxiques typiques des noms étudiés, par exemple leur valence. Ce dictionnaire, dont la version étendue paraîtra sous forme électronique, servira tous ceux qui, pour la rédaction d'un texte, sont à la recherche soit du "mot juste", soit des formules plus ou moins stéréotypées qui représentent les différentes facettes d’une situation complexe.

D'un point de vue linguistique, les recherches sous-jacentes à ce dictionnaire conduiront à la création d'une banque de données qui informera sur ce que nous appelons le "profil combinatoire" des mots.

Ces recherches permettront, dans une perspective wittgensteiniennne :

  • d'élucider de nombreux aspects du contenu lexical du mot à travers son usage ;
  • de déterminer, sur la base des méthodes statistiques indiquées, les corrélations entre les profils combinatoires des synonymes, des antonymes et des mots appartenant au même domaine onomasiologique ;
  • d'évaluer, dans les relations entre hypéronyme et hyponyme, la part de l'"héritage", cette notion portant en l'occurrence sur la combinatoire commune au mot général et au mot spécifique ;
  • de formuler des hypothèses sur les raisons expliquant pourquoi certaines combinaisons sont possibles, d’autres non (exemple : pourquoi il a peur, mais *il a crainte ?).

L'ensemble de ces recherches est relayé par des thèses de doctorat sur la synonymie, l'analyse contrastive français-allemand et la structure de certains vocabulaires spécialisés (exemple : la musicologie).

Collaborent au projet du côté nancéien (CNRS): Pascale Bernard et Josette Lecomte ; du côté colonais (Romanisches Seminar): Peter Blumenthal, Sascha Diwersy, Damon Davison, Anke Grutschus, Estelle Wolst et Jörg Mielebacher (informaticien).

Le projet est soutenu par la Deutsche Forschungsgemeinschaft et par le laboratoire ATILF (Analyse et traitement informatique de la langue française), unité mixte CNRS-Université Nancy 2.