L’objectif du projet est de produire 1) une ressource morpho-sémantique du français (corpus annoté et lexique dérivé) dont la description repose sur un ensemble limité de classes sémantiques et 2) un outil de désambiguïsation à gros grain (reposant sur cet ensemble de classes).

La ressource visée concerne en premier lieu les verbes et les noms. Les verbes pris en compte sont les 50 verbes les plus fréquents dans le corpus utilisé. Les noms annotés regroupent d’une part des noms qui apparaissent comme arguments des verbes sélectionnés, d’autre part des noms qui sont des dérivés morphologiques des verbes sélectionnés.