[WikiFR-l] Corpus

Emmanuel Engelhart emmanuel at engelhart.org
Mer 28 Mar 10:38:21 UTC 2007


Le 28/03/07, Valérie Chansigaud<valerie.chansigaud at wikimedia.fr> a écrit :
> Bonjour,
>
> J'ai discuté avec une chercheuse en littérature qui a un immense corpus de
> textes sur le train. Ces textes sont du XIXe siècle et donc dans le domaine
> public et ne sont pas disponibles ailleurs.
>
>  Elle aimerait savoir s'il serait possible de les mettre, sous forme
> numérique, quelque part sur l'un des projets.
>
> Mais :
>
> La plupart des textes sont en mode image
> Elle n'a pas le temps de faire les OCR et, surtout, de les corriger L'idée
> serait de mettre les textes quelque part et les images sur commons, puis de
> créer un projet spécifique quelque part (WP ? WS ? autre) pour animer tout
> ça.
>
> L'enjeu, au-delà de sa demande, est important. Ce n'est pas la première fois
> que l'on évoque (ou que l'on me propose) la possibilité de monter des
> corpus/projet thématiques. Cela permettrait d'enrichir WP, cela permet de
> donner un rôle (un peu) nouveau aux projets, cela permet de changer le
> regard posé par nombre de spécialistes sur WP.
>
> Ce type de projet/corpus thématique pouvant être décliné à l'infini.
>
> J'aimerais bien avoir vos idées, pistes, critiques, etc.
>
> Valérie
>

http://fr.wikipedia.org/wiki/Portail:Ferrovip%C3%A9dia
http://fr.wikipedia.org/wiki/Projet:Ferrovip%C3%A9dia

C'est la seule chose qui me vient à l'esprit pour l'instant.

Kelson



Plus d'informations sur la liste de diffusion WikiFR-l