Message du 28/03/07 16:29 De : "Pierre Beaudouin" pierre.beaudouin@gmail.com
donc WS utilise comme input les textes numérisés par Gallica et apporte sa valeur ajoutée : la correction après OCR et la transformation en mode texte des fichiers images, qui peut être réalisée grâce à l'important travaille des bénévoles.
Oui, comme le dit Yann ("Europeana ne fera pas de corrections après l'OCR (il faudrait un budget 10 fois plus important)"), c'est un point important ; il ne semble pas possible de remplacer le travail de bénévoles sans un gros budget. Donc, cela semble être un atout considérable pour un projet de bibliothèque numérique. Pour la diffusion des livres, Wikisource me paraît ainsi supérieur : dans quelques années, et avec plus de contributeurs, une immense bibliothèque pourra être téléchargée en mode texte ou distribuée sur DVD, ce qui est difficilement envisageable avec Gallica. D'autres part, la recherche dans le texte est plus simple et plus précise avec un texte corrigé de Wikisource, et l'utilisation du mode page permet de constituer un outil de travail plus souple que Gallica. Par exemple, je fais une thèse sur Nietzsche ; si je cherche un mot, il me suffit d'ouvrir tous les livres de Nietzsche en même temps et de faire la recherche avec mon navigateur, tout en étant en mesure de parcourir chaque page rapidement quand je cherche une référence précise.
En gros, la valeur ajoutée me semble donc être dans le travail "gratuit" des contributeurs et dans les outils de Wikisource qui offrent de plus larges perspectives : Wikisource commence par exemple à fournir quelques traductions et des textes lus. Je pense que Wikisource est actuelement l'outil le plus pratique et le plus complet pour créer une bibliothèque numérique.
Marc
wikisource-l@lists.wikimedia.org