donc WS utilise comme input les textes numérisés par Gallica et apporte
sa valeur ajoutée : la correction après OCR et la transformation en
mode texte des fichiers images, qui peut être réalisée grâce à
l&#39;important travaille des bénévoles.<br><br><br><div><span class="gmail_quote">Le 28/03/07, <b class="gmail_sendername">Yann Forget</b> &lt;<a href="mailto:yann@forget-me.net">yann@forget-me.net</a>&gt; a écrit :</span>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Sébastien Thébault wrote:<br>&gt;&gt; Mais la différence principale est que les textes de Wikisource sont
<br>&gt;&gt; vérifiés et corrigés (en tous cas, c&#39;est l&#39;objectif), et la qualité de<br>&gt;&gt; la publication est notée (sources, conformité à l&#39;original,<br>&gt;&gt; typographie,<br>&gt;&gt; etc.). La qualité des textes de Gutenberg est très aléatoire (une
<br>&gt;&gt; bonne<br>&gt;&gt; partie des textes en français n&#39;ont pas d&#39;accents, ne respectent<br>&gt;&gt; pas la<br>&gt;&gt; typographie, etc.). Seule une petite partie de Gallica est<br>&gt;&gt; disponible en<br>
&gt;&gt; mode texte, et il n&#39;y a pas de correction après OCR.<br>&gt;&gt;<br>&gt;&gt; Cordialement,<br>&gt;&gt;<br>&gt;&gt; Yann<br>&gt;<br>&gt; À noter qu&#39;Europeana propose/proposera la version texte (mais il y a
<br>&gt; encore du déchet à l&#39;OCR)<br><br>Europeana ne fera pas de corrections après l&#39;OCR (il faudrait un budget<br>10 fois plus important).<br><br>Yann<br><br><br></blockquote></div>