Le corpus de français parlé LesVocaux : de la constitution à l’exploitation
05 mars 2026 · 14h00 – 17h00
Lieu :
L’oral est souvent considéré comme le lieu privilégié du changement linguistique (Blanche-Benveniste 2002), ce qui peut expliquer l’intérêt pour l’étude des marques d’oralité, de la représentation de l’oral ou du lien langue parlée / langue écrite (Schnedecker & Vaguer (dir.) 2020, Glikman et al. (dir.) 2019, Ayres-Bennet et al. (dir.) 2018, Blasco & Bodelot (dir.) 2017, Rodriguez Somolinos (dir.) 2016, Lagorgette & Larrivée (dir.) 2013). Cependant, aujourd’hui encore, malgré le développement des corpus oraux (ORFEO, ESLO), l’accès à l’oral spontané reste difficile. Le corpus LesVocaux (Glikman et al. 2025) vise à combler ce manque, à travers la constitution d’un corpus de données inédites de français parlé spontané : les « sms vocaux » ou « vocaux ». Ces données sont spontanément produites en dehors de toute enquête ou entretien linguistique, et constituent ainsi une voie d’accès à la parole spontanée non surveillée, nécessaire pour la description de la langue naturelle. La méthode de recueil a permis de constituer un corpus de plus de 1000 messages, pour une durée totale de plus de 19h de paroles spontanées. Ce projet vient ainsi en complément des corpus de sms écrits (cf. Panckhurst et al. 2013 & Stark 2016-218), et contribue à l’étude des communications médiées et différées, nouveau champ en expansion.
L’objectif de cette communication est de présenter les questions méthodologiques et philologiques qui se posent pour l’édition d’un tel corpus, ainsi qu’un aperçu des premiers résultats tirés du corpus (Glikman et Fauth 2022, Mazziotta et Glikman 2023, Delferrière et Mazziotta 2024, Mazziotta et Glikman accepté, Glikman et Bally soumis). Les premiers résultats montrent des caractéristiques bien connues pour la production de l’oral (faux départs, hésitations, pauses, etc., Blanche-Benveniste et al. 1990) et de nombreuses attestations de marqueurs de discours (du coup, genre, tu vois, en mode) et articulateurs du discours (voilà conclusif, cf. Col et al. 2015). On trouve aussi bien des communications de type interactionnel (1) que des récits, pouvant comporter du discours rapporté au style direct (2) :
- […] et qu’est-ce qui t’a déclenché cette pensée _ explique-moi _ t’es pas moche _ je te le dis (06_03)
- […] et il dit bonjour alors on est là genre bonjour _ et euh _ il sort à #name euh _ ouais euh vous pensez à bien garder les distances de sécurité hein euh alors elle dit ben oui vous voyez bien qu’ils sont espacés _ oui oui non mais je vois je vois hein […] (05_08)
Ayres Bennet, Wendy, Anne Carlier, Julie Glikman, T. M. Rainsford, Gilles Siouffi & Carine Skupien Dekens (ed.). 2018. Nouvelles voies d’accès au changement linguistique. Paris : Classiques Garnier.
Blanche-Benveniste, Claire et al. 1990. Le français parlé. Paris : CNRS éditions.
Blasco, Mylène & Colette Bodelot (ed.). 2017. Langue parlée / langue écrite, du latin au français : un clivage dans l’histoire de la langue ? Langages 208.
Caillat, Domitille. 2013. Le discours rapporté direct dans les conversations orales: un système de balisage multimodal. Cécile Desoutter & Caroline Mellet. Le discours rapporté et ses marques, 178. Berlin: Peter Lang. 63-80.
Col, Gilles, Charlotte Danino & Julien Rault. 2015. Éléments de cartographie des emplois de voilà en vue d’une analyse instructionnelle. Revue de Sémantique et Pragmatique [En ligne], 37 | 2015, mis en ligne le 01 juin 2016, consulté le 12 janvier 2022. URL : http://journals.openedition.org/rsp/1015 ; DOI : https://doi.org/10.4000/rsp.1015.
Delferriere, Fanni et Mazziotta, Nicolas, 2024, « mais tu veux couper là du coup faut dire pourquoi quoi: Propositions complémentaires pour une segmentation syntaxique du français parlé. » In Actes du Congrès mondial de linguistique française 2024. SHS Web of Conf., 191 (2024) 14006. https://doi.org/10.1051/shsconf/202419114006
ESLO : http://eslo.huma-num.fr/index.php/pagecorpus/pageaccescorpus
Glikman, J. et Bally, A.-S. (soumis). Contribution à l’analyse des interactions en français parlé spontané : les formules d’ouverture et de clôture dans les SMS vocaux [manuscrit soumis pour publication]. Université de Lorraine et Université du Québec à Trois-Rivières.
Glikman, J., Mazziotta, N., Benzitoun, C. et al. (2025) LesVocaux [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) – www.ortolang.fr, v0.0.2, https://hdl.handle.net/11403/lesvocaux/v0.0.2.
Glikman, Julie et Fauth, Camille, 2022, « Un Nouvel Accès à La Parole Spontanée : Les Vocaux ». In XXXIVe Journées d’Études Sur La Parole — JEP 2022, 154-62. ISCA. https://doi.org/10.21437/JEP.2022-17.
Glikman, Julie, Gabriella Parussa & Richard Waltereit (ed.). 2019. Les marqueurs du discours en diachronie du français : nouvelles perspectives. Studia Linguistica Romanica, n° 2, 2019, https://studialinguisticaromanica.org/index.php/slr/issue/view/2.
Koch, Peter & Wulf Oesterreicher. 2001. Gesprochene Sprache und geschriebene Sprache / Langage parlé et langage écrit. in Holtus G., Metzeltin M., Schmitt Ch. (ed). Lexikon der Romanistischen Linguistik, Bd. I/2, Tübingen: Niemeyer. 584-627.
Lagorgette, Dominique & Pierre Larrivée (ed.). 2013. Représentations du sens linguistique 5. Chambéry : Presses de l’Université de Savoie.
Mazziotta, Nicolas et Glikman, Julie, 2023, « Emplois discursifs et pragmatiques des formes du verbe écouter: Observations sur les corpus 88milSMS et Les Vocaux ». In Études de sémantique et pragmatique en synchronie et diachronie. Hommage à Amalia Rodríguez Somolinos, édité par Marta Saiz-Sánchez et Sonia Gómez-Jordana Ferary. Chambéry: Presses Universitaires de Savoie Mont Blanc.
Mazziotta, Nicolas et Glikman, Julie, accepté, “Nouvelles données sur l’évolution des emplois de voilà. L’apport du corpus LesVocaux”. Études diachroniques, 5, Français numérique et diachronie, Honoré Champion.
ORFEO : https://www.projet-orfeo.fr/
Panckhurst R., Détrie C., Lopez C., Moïse C., Roche M. et Verine B. 2013. Sud4science, de l’acquisition d’un grand corpus de SMS en français à l’analyse de l’écriture SMS. Épistémè – revue internationale de sciences sociales appliquées, 9 : Des usages numériques aux pratiques scripturales électroniques, 107-138.
Rodriguez Somolinos, Amalia (ed.). 2016. Énonciation et marques d’oralité dans l’évolution du français. Linx 73. Nanterre : Presses universitaires de Paris Nanterre.
Rossari, Corinne & Jacques Jayez. 2000. Du coup et les connecteurs de conséquence dans une perspective dynamique. Lingvisticae investigationes 23.2 (2000). 303-326.
Schnedecker, Catherine & Céline Vaguer (ed.). 2020. L’oral représenté en diachronie et en synchronie : une voie d’accès à l’oral spontané ?. Langages 2020/1 (N° 217).
Stark, Elisabeth. 2016-2018. Projet FSN « What’s up, Switzerland? » (Sinergia: CRSII1_160714). Université de Zurich. www.whatsup-switzerland.ch.
Verine, Bertrand. 2005. Dialogisme interdiscursif et interlocutif du discours rapporté: jeux sur les frontières à l’oral. Jacques Bres (ed.). Dialogisme et polyphonie. Approches linguistiques. Louvain-la-Neuve: De Boeck Supérieur. 187-200.
