Chargement Évènements

« Tous les Évènements

  • Cet évènement est passé

Atelier : Exploration des corpus MICLE et CHRONIQUES

19 octobre 2023 · 14h00 16h00

Organisateur :

Crisco

Animé par

Mathieu Goux (post-doc, projet MICLE, CRISCO)

Rayan Ziane (ingénieur d’étude, projet High-Tech, CRISCO)

Natasha Romanova (coordinatrice, projet MICLE, CRISCO)

Pour plus d’information et pour vous inscrire à l’atelier, veuillez contacter natalia.romanova<AT>unicaen.fr

Contexte

Le laboratoire CRISCO héberge actuellement deux projets de constitution de corpus en diachronie : MICLE* et High-Tech**. Dans le cadre de ces projets nous avons mis à disposition les versions bêta de deux corpus de textes à valeur patrimoniale en français, lemmatisés et annotés en parties de discours et en fonctions syntaxiques.*** Les corpus sont calibrés par genre et par provenance géographique ce qui permettra d’étudier l’évolution de la langue de façon plus fiable.

Le corpus MICLE donne actuellement accès à douze textes juridiques datant du 13e au 17e siècle (actuellement ≈ 350,000 tokens) et le corpus CHRONIQUES résultant du projet High-Tech est constitué par six chroniques et traités historiques produits en Normandie du 12e au 19e siècle, un texte par siècle (actuellement ≈ 200,00 tokens).

Le but de l’atelier

L’objectif de cet atelier qui s’adressera aux collègues et étudiants en sciences du langage, en lettres et en histoire, est de présenter les utilisations possibles des corpus pour les buts de recherche dans un contexte interdisciplinaire. Les corpus donnent accès aux textes et permettent des recherches simples (par exemple par mot) et complexes. Notamment, notre ressource facilite la recherche des objets qui précèdent le verbe ou les noms propres qui sont les sujets de la phrase. Il est également possible de trouver les mots ou les noms les plus utilisés dans les corpus et comparer leur fréquence à travers les textes etc. Les corpus sont actuellement consultables via le portail TXM du CRISCO qui utilise un logiciel de textométrie**** pour interroger des corpus annotés.

À quoi vous attendre

Au cours de la séance, animé par les membres des équipes des deux projets, nous présenterons les contenus et les principes de l’annotation et de l’interrogation des corpus tout en initiant les participants à l’utilisation du logiciel TXM. Nous guiderons les utilisateurs dans des recherches simples et complexes et les aiderons à formuler leurs propres requêtes. Nous voudrions aussi lancer une discussion sur les utilisations possibles de la ressource et solliciter des retours qui nous seront très utile au cours de notre travail sur de nouvelles versions du corpus.

Cet atelier sera présenté en lien avec la conférence sur le corpus High-Tech donnée par Rayan Ziane le jeudi 12 octobre.


*MICLE (Micro-Cues of Language Evolution)

**High-Tech (High-Level Text Annotation across Historical texts)

***Les versions bêta des corpus MICLE et High-Tech sont actuellement disponibles sur le portail TXM du laboratoire CRISCO : https://txm-crisco.huma-num.fr/txm/

**** analyse de données textuelles

Lieu :

Bâtiment B, salle B1-117 (B1)

Esplanade de la Paix
Caen, France