BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//CRISCO - Centre de recherches inter-langues sur la signification en contexte - UR 4255 - ECPv6.16.3//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:CRISCO - Centre de recherches inter-langues sur la signification en contexte - UR 4255
X-ORIGINAL-URL:https://crisco.unicaen.fr
X-WR-CALDESC:Évènements pour CRISCO - Centre de recherches inter-langues sur la signification en contexte - UR 4255
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20220327T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20221030T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20230326T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20231029T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20231012T140000
DTEND;TZID=Europe/Paris:20231012T153000
DTSTAMP:20260610T215012
CREATED:20230914T095440Z
LAST-MODIFIED:20230921T151957Z
UID:48027-1697119200-1697124600@crisco.unicaen.fr
SUMMARY:Présentation du projet HIGH-TECH par Rayan Ziane (Ingénieur d'études)
DESCRIPTION:Objectifs du séminaire\n\n\n\nLe séminaire vise à présenter le projet RIN HIGH-TECH (11/21-10/23)\, porté par le Professeur Pierre Larrivée au CRISCO. Le projet a pour objectif d’améliorer la gestion des vastes ensembles de données historiques en développant des méthodes d’annotation textuelle avancées. La méthode développée a ensuite été utilisée pour annoter un corpus de chroniques normandes couvrant huit siècles d’évolution linguistique (corpus CHRONIQUES).  \n\n\n\n\nNous montrerons les principes du projet\, tout d’abord l’approche hybride\, mêlant méthodes par apprentissage statistique avec un analyseur syntaxique automatique et méthodes par règles\, ensuite l’adaptabilité de la chaîne de traitement et enfin la nature itérative du processus. Cette approche permet un traitement approfondi du corpus tout en restant économique\, couvrant à la fois l’annotation en parties du discours\, la lemmatisation et même les premières fonctions syntaxiques.\n\n\n\n\nLa création du corpus s’est appuyée sur des ressources et des compétences issues de projets antérieurs\, tout en tenant compte des exigences scientifiques et de la disponibilité des outils nécessaires pour traiter un grand corpus dans des délais raisonnables. \n\n\n\n\nLe corpus CHRONIQUES\, annoté au format XML-TEI\, est visualisable et interrogeable via le portail TXM du CRISCO qui permet des requêtes en CQL (corpus query language) et via un nouveau site du projet actuellement en cours de développement. Nous présenterons les deux outils et les requêtes qui permettent d’étudier l’évolution des structures syntaxiques ainsi que du vocabulaire en s’appuyant sur les métadonnées présentes dans les fichiers annotés. Parmi d’autres exemples de l’utilisation du corpus\, nous citerons la possibilité d’explorer les noms propres mentionnés dans les chroniques et d’analyser l’agentivité des différents personnages historiques. Le corpus outillé facilite donc le repérage des phénomènes recherchés ainsi que la production d’études statistiques sur la totalité du corpus ou des textes sélectionnés par l’utilisateur.\n\n\n\n\nDans l’esprit de nos collaborations et échanges avec les collègues de l’équipe MICLE et les autres collègues au CRISCO et ainsi qu’avec les stagiaires qui avaient travaillé sur le projet au cours des deux dernières années\, le séminaire et l’atelier d’exploration des corpus CHRONIQUES et MICLE prévu pour le 19 octobre\, encourageront la participation et les retours des participants pouvant conduire à des développements continus pour améliorer la qualité des données et de la méthodologie existantes. \n\n\n\n\nLa validation des annotations automatiques participe à la mise en lumière des erreurs tout en contribuant à la constitution d’une nouvelle base de réentrainement de modèles pour l’annotation de corpus en diachronie. En regardant vers l’avenir\, le séminaire évoquera la nécessité d’évaluer les performances des outils existants afin d’améliorer nos processus\, ce qui représentera un des objectifs du nouveau projet RIN AUTOMATED qui  débutera au CRISCO en décembre 2023. 
URL:https://crisco.unicaen.fr/evenement/presentation-du-projet-high-tech/
LOCATION:Caen · Campus 1 · CRISCO · Salle de documentation\, Centre de recherche CRISCO\, Caen\, 14000\, France
CATEGORIES:Séminaire
ATTACH;FMTTYPE=image/png:https://crisco.unicaen.fr/wp-content/uploads/sites/43/2023/09/flyer_4.png
END:VEVENT
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20231019T140000
DTEND;TZID=Europe/Paris:20231019T160000
DTSTAMP:20260610T215012
CREATED:20230914T124240Z
LAST-MODIFIED:20250221T081408Z
UID:48029-1697724000-1697731200@crisco.unicaen.fr
SUMMARY:Atelier : Exploration des corpus MICLE et CHRONIQUES
DESCRIPTION:Animé par\n\n\n\nMathieu Goux (post-doc\, projet MICLE\, CRISCO) \n\n\n\nRayan Ziane (ingénieur d’étude\, projet High-Tech\, CRISCO) \n\n\n\nNatasha Romanova (coordinatrice\, projet MICLE\, CRISCO) \n\n\n\nPour plus d’information et pour vous inscrire à l’atelier\, veuillez contacter natalia.romanova<AT>unicaen.fr \n\n\n\nContexte\n\n\n\nLe laboratoire CRISCO héberge actuellement deux projets de constitution de corpus en diachronie : MICLE* et High-Tech**. Dans le cadre de ces projets nous avons mis à disposition les versions bêta de deux corpus de textes à valeur patrimoniale en français\, lemmatisés et annotés en parties de discours et en fonctions syntaxiques.*** Les corpus sont calibrés par genre et par provenance géographique ce qui permettra d’étudier l’évolution de la langue de façon plus fiable. \n\n\n\nLe corpus MICLE donne actuellement accès à douze textes juridiques datant du 13e au 17e siècle (actuellement ≈ 350\,000 tokens) et le corpus CHRONIQUES résultant du projet High-Tech est constitué par six chroniques et traités historiques produits en Normandie du 12e au 19e siècle\, un texte par siècle (actuellement ≈ 200\,00 tokens). \n\n\n\nLe but de l’atelier\n\n\n\nL’objectif de cet atelier qui s’adressera aux collègues et étudiants en sciences du langage\, en lettres et en histoire\, est de présenter les utilisations possibles des corpus pour les buts de recherche dans un contexte interdisciplinaire. Les corpus donnent accès aux textes et permettent des recherches simples (par exemple par mot) et complexes. Notamment\, notre ressource facilite la recherche des objets qui précèdent le verbe ou les noms propres qui sont les sujets de la phrase. Il est également possible de trouver les mots ou les noms les plus utilisés dans les corpus et comparer leur fréquence à travers les textes etc. Les corpus sont actuellement consultables via le portail TXM du CRISCO qui utilise un logiciel de textométrie**** pour interroger des corpus annotés. \n\n\n\nÀ quoi vous attendre\n\n\n\nAu cours de la séance\, animé par les membres des équipes des deux projets\, nous présenterons les contenus et les principes de l’annotation et de l’interrogation des corpus tout en initiant les participants à l’utilisation du logiciel TXM. Nous guiderons les utilisateurs dans des recherches simples et complexes et les aiderons à formuler leurs propres requêtes. Nous voudrions aussi lancer une discussion sur les utilisations possibles de la ressource et solliciter des retours qui nous seront très utile au cours de notre travail sur de nouvelles versions du corpus. \n\n\n\nCet atelier sera présenté en lien avec la conférence sur le corpus High-Tech donnée par Rayan Ziane le jeudi 12 octobre. \n\n\n\n\n\n\n\n*MICLE (Micro-Cues of Language Evolution) \n\n\n\n\nfinancé par ANR/DFG 2021-2024\n\n\n\nporté par Professeur Pierre Larrivée (Université de Caen) et Professeure Cecilia Poletto (Université de Francfort)\n\n\n\nhttps://www.unicaen.fr/projet_de_recherche/micle/ \n\n\n\n\n**High-Tech (High-Level Text Annotation across Historical texts) \n\n\n\n\nfinancé par le Réseau d’intérêts normands (RIN) 2021-2023 \n\n\n\nporté par Professeur Pierre Larrivée (Université de Caen)\n\n\n\nhttps://www.unicaen.fr/projet_de_recherche/high-tech/ \n\n\n\n\n***Les versions bêta des corpus MICLE et High-Tech sont actuellement disponibles sur le portail TXM du laboratoire CRISCO : https://txm-crisco.huma-num.fr/txm/ \n\n\n\n**** analyse de données textuelles
URL:https://crisco.unicaen.fr/evenement/atelier-high-tech/
LOCATION:Caen · Campus 1 · Bâtiment B · Salle B1-117\, Bâtiment B\, Esplanade de la Paix\, Caen\, 14000\, France
CATEGORIES:Séminaire
END:VEVENT
END:VCALENDAR