Développement de ressources pour le traitement automatique de corpus finnois.
Ces ressources sont principalement constituées de dictionnaires, de graphes et de programmes. Elles permettent la reconnaissance et l’analyse des formes fléchies des mots simples et complexes du finnois, langue synthétique et agglutinante dont la régularité et la productivité de la composition est également importante. Les ressources ont été développées pour la plateforme d’analyse de corpus Unitex, mais le format des données et la diffusion de ces ressources sous licence libre rendent possible leur adaptation pour d’autres usages en traitement automatique des langues.