Cette opération consiste à construire un système de reconnaissance automatique des chaînes de coréférences capable d’opérer sur des textes bruts. Il s’agit 1) d’identifier les mentions référentielles dans les textes bruts (certains pronoms, groupes nominaux ou entités nommées) et 2) de les regrouper en ensembles co-référentiel. Des méthodes d’apprentissage automatique sont proposées pour les deux sous-tâches, qui sont testées à la fois conjointement et en séquence, afin de mesurer l’influence de l’une sur l’autre. Il s’agit aussi d’étudier la combinaison des méthodes d’apprentissage automatique avec l’exploitation de ressources externes et de chercher les paramétrages les plus efficaces pour la langue française, en contrastant les résultats obtenus avec ceux accessibles sur les corpus en anglais.