You are currently viewing CAENNAIS (Corpus Audio d’Étudiants Natifs et non-Natifs en InteractionS)

CAENNAIS (Corpus Audio d’Étudiants Natifs et non-Natifs en InteractionS)

CAENNAIS (Corpus Audio d’Étudiants Natifs et non-NAtifs en InteractionS). Projet pédagogique de constitution d’un corpus oral d’apprenants du français

Le projet CAENNAIS est un projet pédagogique prévu pour la période d’octobre 2023 à septembre 2024 et réalisé par une équipe de recherche constituée de membres du Laboratoire CRISCO et des masterants de l’Université de Caen Normandie. Co-géré par Catrine Bang-Nilsen, Natasha Romanova et Rayan Ziane, ce projet découle d’un projet de stage effectué en 2022-2023 par Florian Peck (M2 en Sciences du Langage parcours LTD) et Orlanne Pinsault (M2 en Sciences du Langage parcours didactique du FLE) et vise à développer des protocoles et des bonnes pratiques pour de futurs projets de collecte et traitement de données orales des apprenants du français.

Ce projet voit pour but la constitution d’un corpus d’interactions entre étudiants francophones natifs et étudiants non-natifs dont la langue maternelle est le norvégien. Les échanges feront l’objet d’un enregistrement audio trois fois au cours de l’année 2023-2024. à la fin du projet les enregistrements anonymisés seront mis à disposition des chercheurs via une plateforme de dépôt de données orales. Une partie des données seront transcrites en utilisant le logiciel ELAN, annotées syntaxiquement en suivant la chaîne de traitement développée dans le cadre du projet High-Tech et également mises à disposition.

Les processus de collecte des données, de transcription et annotation élaborés par le projet CAENNAIS seront décrits dans une documentation future.