[Wikisource-l] [Wikimediafr-l] Re : Wikisource : la question piège ?

Pierre Beaudouin pierre.beaudouin at gmail.com
Wed Mar 28 14:28:56 UTC 2007


donc WS utilise comme input les textes numérisés par Gallica et apporte sa
valeur ajoutée : la correction après OCR et la transformation en mode texte
des fichiers images, qui peut être réalisée grâce à l'important travaille
des bénévoles.


Le 28/03/07, Yann Forget <yann at forget-me.net> a écrit :
>
> Sébastien Thébault wrote:
> >> Mais la différence principale est que les textes de Wikisource sont
> >> vérifiés et corrigés (en tous cas, c'est l'objectif), et la qualité de
> >> la publication est notée (sources, conformité à l'original,
> >> typographie,
> >> etc.). La qualité des textes de Gutenberg est très aléatoire (une
> >> bonne
> >> partie des textes en français n'ont pas d'accents, ne respectent
> >> pas la
> >> typographie, etc.). Seule une petite partie de Gallica est
> >> disponible en
> >> mode texte, et il n'y a pas de correction après OCR.
> >>
> >> Cordialement,
> >>
> >> Yann
> >
> > À noter qu'Europeana propose/proposera la version texte (mais il y a
> > encore du déchet à l'OCR)
>
> Europeana ne fera pas de corrections après l'OCR (il faudrait un budget
> 10 fois plus important).
>
> Yann
>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://lists.wikimedia.org/pipermail/wikisource-l/attachments/20070328/63d0cbcb/attachment.htm 


More information about the Wikisource-l mailing list