- Cet évènement est passé.
Exploration des corpus MICLE et CHRONIQUES
19 octobre 2023 · 14h00 – 16h00
Atelier du laboratoire CRISCO · UR 4255, année 2023-2024, jeudi 19 octobre, à 14h, dans la salle de documentation du CRISCO, bâtiment N, sous-sol.
Responsables scientifiques : Mathieu Goux (post-doc, projet MICLE, CRISCO), Rayan Ziane (ingénieur d’étude, projet High-Tech, CRISCO) et Natasha Romanova (coordinatrice, projet MICLE, CRISCO)
Programme
Le laboratoire CRISCO héberge actuellement deux projets de constitution de corpus en diachronie : MICLE et High-Tech. Dans le cadre de ces projets nous avons mis à disposition les versions bêta de deux corpus de textes à valeur patrimoniale en français, lemmatisés et annotés en parties de discours et en fonctions syntaxiques. Les corpus sont calibrés par genre et par provenance géographique ce qui permettra d’étudier l’évolution de la langue de façon plus fiable.
Le corpus MICLE donne actuellement accès à douze textes juridiques datant du 13e au 17e siècle (actuellement ≈ 350,000 tokens) et le corpus CHRONIQUES résultant du projet High-Tech est constitué par six chroniques et traités historiques produits en Normandie du 12e au 19e siècle, un texte par siècle (actuellement ≈ 200,00 tokens).
L’objectif de cet atelier qui s’adressera aux collègues et étudiants en sciences du langage, en lettres et en histoire, est de présenter les utilisations possibles des corpus pour les buts de recherche dans un contexte interdisciplinaire. Les corpus donnent accès aux textes et permettent des recherches simples (par exemple par mot) et complexes. Notamment, notre ressource facilite la recherche des objets qui précèdent le verbe ou les noms propres qui sont les sujets de la phrase. Il est également possible de trouver les mots ou les noms les plus utilisés dans les corpus et comparer leur fréquence à travers les textes etc. Les corpus sont actuellement consultables via le portail TXM du CRISCO qui utilise un logiciel de textométrie pour interroger des corpus annotés.
Lire la suite