L’unité génétique et la classification interne du phylum Niger-Congo demeure en grand partie problématique. La relative lenteur des progrès dans ce domaine est due à plusieurs facteurs, dont, entre autres, le très grand nombre de langues impliquées, le manque de données dans certaines régions cruciales (en particulier le Nigeria) et l’existence de vastes aires de diffusion. En utilisant la base de données RefLex et ses outils, Konstantin Pozdniakov  et Guillaume Segerer ont récemment développé une méthode innovante permettant la génération d’hypothèses à partir de la détection de séries d’homophones réguliers. Cette méthode ouvre des pistes prometteuses pour la linguistique historique du continent africain.

La découverte d’homophonies régulières, définies comme des ensembles de termes présentant les mêmes sens multiples et indépendants, fournit un argument très fort pour l’établissement ou la confirmation de liens génétiques entre les langues, mais aussi pour la découverte de correspondances phonétiques régulières. A titre d’exemple, le tableau 1 ci-dessous présente le cas d’un lexème ayant le même schéma d’homophonie dans trois langues Niger-Congo lointainement apparentées, le kare [kare1338] (RCA, classé “Adamawa”), le khana [khan1278] (Nigeria, Delta-Cross) et le kete [kete1252] (RDC, Bantu) :

Dans la mesure où une telle convergence est statistiquement hautement imoprobable, une telle série fournit un fort signal phylogénétique. Par conséquent, les sons impliquées doivent illustrer une correspondance phonétique régulière, même dans le cas où une seule série homophonique est découverte. Cette correspondance peut dès lors être testée sur d’autres lexèmes des langues en question, comme l’illustre brièvement le tableau 2

Seules les séries ‘oreille’ et ‘cendre’ sont complètes pour les trois langues, mais ces séries permettent de confirmer la validité des séries incomplètes.

Pour ce projet, le/la doctorant.e utilisera la base de données RefLex pour rechercher systématiquement de tels schémas d’homophonie régulière, puis testera les hypothèses correspondantes en termes de classification et de reconstruction, en collaboration avec les spécialistes des divers groupes Niger-Congo présents au LLACAN.

Le/la candidat.e retenu.e apportera une importante contribution à la délimitation et à la classification interne du phylum linguistique Niger-Congo, ainsi qu’à la reconstruction de certaines de ses branches, grâce à la détection d’homophonies régulières dans la très grande base de données RefLex.

Contexte de recherche: LABEX-EFL, Axe 3, Opération de recherche GL7  Reconstruction, généalogie, typologie et description grammaticale dans les deux plus grands phylums du monde : niger-congo et austronésien (resp. Isabelle Bril, Alexandre François, Mark van de Velde)

Contexte institutionnel: INALCO & LLACAN. Le LLACAN est une équipe renommée et dynamique d’experts dans le domaine des langues et de la linguistique africaines. Il est situé en proche banlieue sud, desservi par le métro et autres transports en commun. Le/la candidat.e aura le statut de doctorant à l’INALCO, sous la direction de Guillaume Segerer, Mark van de Velde et/ou Konstantin Pozdniakov.

Le/la candidat.e devra remplir les conditions suivantes :

  • être titulaire d’un Master en Sciences du Langage ;
  • avoir un intérêt marqué pour la linguistique historique, les langues africaines et les bases de données linguistiques ;
  • être familier avec les outils bureautiques, et avoir un certain goût pour les approches quantitatives ;
  • être capable de travailler en français et en anglais.

Contact : Mark van de Velde (mark.vandevelde@cnrs.fr).