Axe 2 : Grammaire Expérimentale dans une perspective Cross-Linguistique (responsable : Anne Abeillé – LLF-Paris7)

Le but de cet axe est de généraliser l’usage de méthodes quantitatives et expérimentales pour étudier tous les types de phénomènes grammaticaux, à travers un vaste ensemble de langues, écrites ou orales. Plus précisément, il s’agit de :

– Evaluer les protocoles expérimentaux existants pour l’étude de la morphologie, de la syntaxe, de la sémantique et de la pragmatique, et de définir de nouveaux protocoles si nécessaire,

– Contribuer à la construction de ressources électroniques spécifiques, en particulier pour les langues peu dotées, en relation avec l’axe 6,

– Evaluer la pertinence des méthodes quantitatives et statistiques existantes pour l’étude de différentes données de langue, et de définir de nouvelles méthodes si nécessaire,

– Appliquer ces méthodes à des langues typologiquement variées (selon la disponibilité de locuteurs pour des expériences et l’existence de corpus écrits ou oraux).

Dans un premier temps, le travail s’est concentré sur une quinzaine de langues, pour lesquelles existent des ressources électroniques de grande taille. Ensuite, en fonction des compétences des membres du projet et de la construction de nouvelles ressources, la recherche a pu s’étendre à un échantillon plus équilibré de langues, du point de vue typologique. Nous étudions ainsi les langues romanes, germaniques, slaves, sino-tibétaines, sémitiques, caucasiennes, iraniennes… auxquelles s’ajoutent les créoles et les langues des signes.

Les phénomènes étudiés appartiennent à la morphologie, la syntaxe, la sémantique, la pragmatique et leurs interfaces.

Nos 16 opérations sont organisées en 4 sous-axes, selon ces sous-disciplines, même si la majorité d’entre elles concerne des questions d‘interface.

La Morphologie expérimentale vise à comparer les modèles grammaticaux et ceux du lexique mental pour la morphologie. Morph1 s’intéresse à la définition et à la mesure de la complexité flexionnelle à travers les langues, et cherche à déterminer quelles dimensions de la complexité ont un effet mesurable sur le traitement humain. Morph3 étudie comment des processus concurrents de formation de lexème (1 forme~n sens ou 1 sens~n formes) influencent le comportement du locuteur. Morph4 étudie la morphologie gabaritique, en étendant les gabarits au-delà des langues sémitiques, et en tentant de les réduire à des primitives plus simples.

En Syntaxe expérimentale, il s’agit d’étudier les préférences gouvernant le choix d’une construction dans le cas d’une alternance, le poids des différents facteurs et leur variation à travers les langues. Y a-t-il une différence de nature entre contraintes « catégoriques » pour la bonne formation syntaxique et contraintes « flexibles » pour les préférences syntaxiques ? Nous travaillons sur deux types d’alternances : variation d’ordre des constituants (WO) et alternance de constructions (SA). WO1 étudie l’ordre relatif des compléments du verbe comparant le français, le persan et les langues germaniques. WO2 étudie l’ordre des constituants en début de phrase (périphérie gauche) selon leur rôle discursif et leur prosodie, en relation avec GD1 (Axe 3). Les autres opérations sont consacrées à des alternances de construction. SA1 étudie l’alternance dative dans différentes variétés de Mandarin, comparées à l’anglais, SA2 l’alternance entre indicatif et subjonctif, dans les langues romanes et balkaniques, dans les complétives et les interrogatives, SA3 l’alternance entre phrase complète et phrase elliptiques dans des langues variées et SA4 l’alternance de valence verbale, par exemple actif/passif ou construction impersonnelle. Enfin, REL étudie la variété des relatives, du point de vue de leur typologie, de leur acquisition et de leur traitement, en relation avec l’opération LC3 de l’axe 3, y compris dans plusieurs langues des signes européennes. Ces différentes opérations reposent sur une méthodologie similaire : extraction de préférences à partir de fréquences établies sur de gros corpus annotés, qui sont ensuite testées par des protocoles expérimentaux.

La Sémantique expérimentale se consacre aux anaphores, y compris les pronoms nuls, selon différentes perspectives (ANA). Ana1/2 étudie les différences interlangues concernant la résolution des pronoms et comment l’activation des référents de discours- considéré jusqu’à présent comme le facteur principal- interagit avec d’autres facteurs syntaxiques et discursifs. Il s’agit d’études sur corpus et expérimentales qui tiennent compte des relations de discours entre phrases. Le but d’ANA4 est plus théorique : il s’agit d’évaluer différentes théories de la résolution d’anaphore (basées sur la saillance, le centrage, les relations rhétoriques, ou les maximes de Grice) en les comparant aux modèles utilisés en psycholinguistique et en traitement automatique (algorithmes probabilistes). Enfin, Ana5 se consacre aux anaphores temporelles et évènementielles et à l’ordonnancement temporel du discours, en relation avec l’opération GD4 (Typologie du TAME) de l’axe 3. L’opération PLU s’intéresse à la pluralité en relation avec l’individuation de la référence à travers les langues.

La Pragmatique expérimentale explore la place du dialogue pour les questions centrales de la grammaire et le tournant expérimental. (DIA) se consacre aux modèles de dialogue, en lien avec OLA8 (Non sentential utterances) de l’axe 4. On fait l’hypothèse que les énoncés sont intrinsèquement dialogiques, à partir du moment où leur forme, leur sens et leur valeur illocutoire dépend de leur insertion dans l’interaction présente, et donc que la modélisation du dialogue est un enjeu crucial pour l’architecture de la grammaire.

Les travaux de cet axe rassemblent plus de 50 chercheurs et enseignants-chercheurs, 5 postdocs et 25 doctorants des 10 équipes partenaires, sans compter les membres individuels. Ce sont des spécialistes de linguistique, linguistique informatique et psycholinguistique, avec de nombreuses collaborations nationales et internationales.

Morphologie expérimentale

  • Morph1 La complexité empirique des systèmes flexionnels (resp O. Bonami): LLF, Lacan, Lacito, Sedyl
  • Morph3 La nature plurivoque de la formation de lexèmes (resp L. Barque) : LLF, Lattice
  • Morph4 Morphologie gabaritique (resp. C. Reintges) : LLF, LPP-P3

Syntaxe expérimentale

  • WO1 Préférences d’ ordre des compléments (resp. A. Abeillé, B. Crabbé) : LLF, MII, Lattice
  • WO2 La périphérie gauche : une approche informationnelle et discursive. (resp. L. Brunetti) : LLF, Llacan, Sedyl
  • WO3  Ordre des complements en ancien français (resp. B. Crabbé, S. Prévost): LLF, Lattice
  • SA1 Alternance dative en Mandarin (resp. C. Saillard): LLF, CRLAO
  • SA2 Alternance de mode en phrase racine et subordonnée (resp. D. Godard, S. Vassilaki): LLF, Sedyl, Lacito
  • SA3 Alternance phrases elliptiques / phrases complètes (resp. A. Abeillé) : LLF, Lacito
  • SA4 Quasi Synonymie, Equivalence de sens et Variation syntaxique (resp. H Burnett, B Gehrke) : LLF, Llacan
  • REL Relative clauses : acquisition, processing, typology (resp. C. Donati) : LLF, MII, Sedyl

 

Sémantique expérimentale

  • Ana1-2  La résolution d’anaphore à travers les langues (resp. B. Hemforth): LLF, Lattice
  • Ana4 Modélisation de la résolution d’anaphore (resp. P. Amsili): LLF, LIPN
  • Ana5 Anaphores évènementielles et ordonnancement temporel (resp. P. Caudal): LLF, Lacito, MII, Sedyl
  • PLU Pluralités et individuation de la référence, (resp. C. Dobrovie-Sorin, L. Tovena): LLF, LIPN, MII, Sedyl

 

Pragmatique expérimentale

 

  • DIA Modélisation du langage en interaction (resp. J. Ginzburg): LLF