[WikiFR-l] Corpus

Valérie Chansigaud valerie.chansigaud at wikimedia.fr
Mer 28 Mar 10:32:18 UTC 2007


Bonjour,

J'ai discuté avec une chercheuse en littérature qui a un immense corpus de
textes sur le train. Ces textes sont du XIXe siècle et donc dans le domaine
public et ne sont pas disponibles ailleurs.

Elle aimerait savoir s'il serait possible de les mettre, sous forme
numérique, quelque part sur l'un des projets.

Mais :

   - La plupart des textes sont en mode image
   - Elle n'a pas le temps de faire les OCR et, surtout, de les corriger

L'idée serait de mettre les textes quelque part et les images sur commons,
puis de créer un projet spécifique quelque part (WP ? WS ? autre) pour
animer tout ça.

L'enjeu, au-delà de sa demande, est important. Ce n'est pas la première fois
que l'on évoque (ou que l'on me propose) la possibilité de monter des
corpus/projet thématiques. Cela permettrait d'enrichir WP, cela permet de
donner un rôle (un peu) nouveau aux projets, cela permet de changer le
regard posé par nombre de spécialistes sur WP.

Ce type de projet/corpus thématique pouvant être décliné à l'infini.

J'aimerais bien avoir vos idées, pistes, critiques, etc.

Valérie
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: http://lists.wikimedia.org/pipermail/wikifr-l/attachments/20070328/db6be553/attachment.htm 


Plus d'informations sur la liste de diffusion WikiFR-l