Les capacités de numérisation et de traitement informatique des langues varient considérablement d'une langue à une autre et dépendent fortement des ressources disponibles. L'impact est indéniable sur les outils disponibles, autant pour la création et l'acquisition de données (saisie / OCR / reconnaissance de parole) dans les langues concernées, ou leur traitement (moteurs de recherche, encyclopédies, apprentissage des langues, chatbots, etc.).
Face à ce constat, de nombreux projets ont été initiés ces dernières années pour faciliter la contribution et le partage des ressources linguistiques. Ceux-ci concernent la production de données linguistique, comme les corpus oraux ou écrits, les dictionnaires et lexiques, les grammaires, etc. Actuellement, un des enjeux est de permettre à tou·te·s de contribuer efficacement sur ces plateformes.
L'événement ContribuLing, co-organisé par l'INALCO, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin 2021 en ligne (si la situation le permet, en présentiel à Paris et/ou à Montréal), propose aux plateformes d'organiser des présentations et des ateliers dédiés à ces plateformes. Notre objectif est de proposer aux participant·e·s des conférences sur la création et l'utilisation de ces outils ainsi que des ateliers dédiés permettant aux responsables de ces plateformes d'expliquer leur démarche et de former de potentiel·le·s contributeur·rice·s.
Il s'agit en premier lieu de permettre au plus grand nombre de prendre en main ces plateformes pendant ces journées, afin qu'elles·ils puissent par la suite contribuer en ligne. Nous espérons également que cet événement permettra de constituer ou renforcer des communautés d'utilisateur·rice·s autour des outils et des plateformes présentées. Les ateliers n'auront pas vocation à constituer des jeux de données au cours de ces journées, mais d'apporter aux participant·e·s la capacité de le faire par la suite.
Pour proposer une présentation ou un atelier lors de ces journées, nous vous prions de bien vouloir nous envoyer votre proposition (maximum deux pages) avant le 9 avril 2021 à l'adresse contribuling@framalistes.org avec, autant que possible, les informations suivantes : - noms, prénoms, affiliation des organiteur-rice-s de l'atelier, - durée envisagée de l'atelier, - nom de la plateforme contributive, - langue dans laquelle sera présenté l'atelier, - langues actuellement prises en charge par la plateforme, - volume des données déjà présentes sur la plateforme, - licence de la plateforme (code) et des données linguistiques collectées, - description sommaire de l'outil (10 lignes), - modalités d'accès à la plateforme (en ligne, authentification, etc.), - prérequis de compétences en informatique et/ou en linguistique, - moyens nécessaires à l'organisation de l'atelier, - autres informations liées à la bonne organisation de l'atelier.
À partir de ces informations, le comité d'organisation de ContribuLing examinera les propositions d'ateliers et proposera aux ateliers retenus des plages horaires afin d'établir un programme sur les deux journées concernées. Une fois ce programme établi sur ces deux journées, l'événement sera diffusé plus largement, il contiendra des présentations sur les outils et les plateformes afin de faire avancer la réflexion sur leur conception et leur utilisation, ainsi que les ateliers proposant aux locuteurs des langues prises en charge de contribuer sur ces plateformes par la suite.
Adélaide Calais (Wikimedia France) Claire Camberlein (BULAC) Johanna Cordova (INALCO ERTIM) Hugo Lopez (Wikimedia France / LinguaLibre) Damien Nouvel (INALCO ERTIM) Thérèse Ottawa (Wikimedia Canada) Fatiha Sadat (UQAM) Anass Sedrati (Wikimedia Maroc) Emma Vadillo (Wikimedia France / LinguaLibre)
wikimedia-ma@lists.wikimedia.org