donc WS utilise comme input les textes numérisés par Gallica et apporte
sa valeur ajoutée : la correction après OCR et la transformation en
mode texte des fichiers images, qui peut être réalisée grâce à
l'important travaille des bénévoles.<br><br><br><div><span class="gmail_quote">Le 28/03/07, <b class="gmail_sendername">Yann Forget</b> <<a href="mailto:yann@forget-me.net">yann@forget-me.net</a>> a écrit :</span>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Sébastien Thébault wrote:<br>>> Mais la différence principale est que les textes de Wikisource sont
<br>>> vérifiés et corrigés (en tous cas, c'est l'objectif), et la qualité de<br>>> la publication est notée (sources, conformité à l'original,<br>>> typographie,<br>>> etc.). La qualité des textes de Gutenberg est très aléatoire (une
<br>>> bonne<br>>> partie des textes en français n'ont pas d'accents, ne respectent<br>>> pas la<br>>> typographie, etc.). Seule une petite partie de Gallica est<br>>> disponible en<br>
>> mode texte, et il n'y a pas de correction après OCR.<br>>><br>>> Cordialement,<br>>><br>>> Yann<br>><br>> À noter qu'Europeana propose/proposera la version texte (mais il y a
<br>> encore du déchet à l'OCR)<br><br>Europeana ne fera pas de corrections après l'OCR (il faudrait un budget<br>10 fois plus important).<br><br>Yann<br><br><br></blockquote></div>