BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//CRISCO - Centre de recherches inter-langues sur la signification en contexte - UR 4255 - ECPv6.15.18//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-ORIGINAL-URL:https://crisco.unicaen.fr
X-WR-CALDESC:Évènements pour CRISCO - Centre de recherches inter-langues sur la signification en contexte - UR 4255
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20220327T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20221030T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20230326T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20231029T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20231012T140000
DTEND;TZID=Europe/Paris:20231012T153000
DTSTAMP:20260429T183727
CREATED:20230914T095440Z
LAST-MODIFIED:20230921T151957Z
UID:48027-1697119200-1697124600@crisco.unicaen.fr
SUMMARY:Présentation du projet HIGH-TECH par Rayan Ziane (Ingénieur d'études)
DESCRIPTION:Objectifs du séminaire\n\n\n\nLe séminaire vise à présenter le projet RIN HIGH-TECH (11/21-10/23)\, porté par le Professeur Pierre Larrivée au CRISCO. Le projet a pour objectif d’améliorer la gestion des vastes ensembles de données historiques en développant des méthodes d’annotation textuelle avancées. La méthode développée a ensuite été utilisée pour annoter un corpus de chroniques normandes couvrant huit siècles d’évolution linguistique (corpus CHRONIQUES).  \n\n\n\n\nNous montrerons les principes du projet\, tout d’abord l’approche hybride\, mêlant méthodes par apprentissage statistique avec un analyseur syntaxique automatique et méthodes par règles\, ensuite l’adaptabilité de la chaîne de traitement et enfin la nature itérative du processus. Cette approche permet un traitement approfondi du corpus tout en restant économique\, couvrant à la fois l’annotation en parties du discours\, la lemmatisation et même les premières fonctions syntaxiques.\n\n\n\n\nLa création du corpus s’est appuyée sur des ressources et des compétences issues de projets antérieurs\, tout en tenant compte des exigences scientifiques et de la disponibilité des outils nécessaires pour traiter un grand corpus dans des délais raisonnables. \n\n\n\n\nLe corpus CHRONIQUES\, annoté au format XML-TEI\, est visualisable et interrogeable via le portail TXM du CRISCO qui permet des requêtes en CQL (corpus query language) et via un nouveau site du projet actuellement en cours de développement. Nous présenterons les deux outils et les requêtes qui permettent d’étudier l’évolution des structures syntaxiques ainsi que du vocabulaire en s’appuyant sur les métadonnées présentes dans les fichiers annotés. Parmi d’autres exemples de l’utilisation du corpus\, nous citerons la possibilité d’explorer les noms propres mentionnés dans les chroniques et d’analyser l’agentivité des différents personnages historiques. Le corpus outillé facilite donc le repérage des phénomènes recherchés ainsi que la production d’études statistiques sur la totalité du corpus ou des textes sélectionnés par l’utilisateur.\n\n\n\n\nDans l’esprit de nos collaborations et échanges avec les collègues de l’équipe MICLE et les autres collègues au CRISCO et ainsi qu’avec les stagiaires qui avaient travaillé sur le projet au cours des deux dernières années\, le séminaire et l’atelier d’exploration des corpus CHRONIQUES et MICLE prévu pour le 19 octobre\, encourageront la participation et les retours des participants pouvant conduire à des développements continus pour améliorer la qualité des données et de la méthodologie existantes. \n\n\n\n\nLa validation des annotations automatiques participe à la mise en lumière des erreurs tout en contribuant à la constitution d’une nouvelle base de réentrainement de modèles pour l’annotation de corpus en diachronie. En regardant vers l’avenir\, le séminaire évoquera la nécessité d’évaluer les performances des outils existants afin d’améliorer nos processus\, ce qui représentera un des objectifs du nouveau projet RIN AUTOMATED qui  débutera au CRISCO en décembre 2023. 
URL:https://crisco.unicaen.fr/evenement/presentation-du-projet-high-tech/
LOCATION:Caen · Campus 1 · CRISCO · Salle de documentation\, Centre de recherche CRISCO\, Caen\, 14000\, France
CATEGORIES:Séminaire
ATTACH;FMTTYPE=image/png:https://crisco.unicaen.fr/wp-content/uploads/sites/43/2023/09/flyer_4.png
END:VEVENT
END:VCALENDAR