donc WS utilise comme input les textes numérisés par Gallica et apporte sa valeur ajoutée : la correction après OCR et la transformation en mode texte des fichiers images, qui peut être réalisée grâce à l'important travaille des bénévoles.
Le 28/03/07, Yann Forget yann@forget-me.net a écrit :
Sébastien Thébault wrote:
Mais la différence principale est que les textes de Wikisource sont vérifiés et corrigés (en tous cas, c'est l'objectif), et la qualité de la publication est notée (sources, conformité à l'original, typographie, etc.). La qualité des textes de Gutenberg est très aléatoire (une bonne partie des textes en français n'ont pas d'accents, ne respectent pas la typographie, etc.). Seule une petite partie de Gallica est disponible en mode texte, et il n'y a pas de correction après OCR.
Cordialement,
Yann
À noter qu'Europeana propose/proposera la version texte (mais il y a encore du déchet à l'OCR)
Europeana ne fera pas de corrections après l'OCR (il faudrait un budget 10 fois plus important).
Yann