Message du 28/03/07 16:29
De : "Pierre Beaudouin" <pierre.beaudouin(a)gmail.com>
donc WS utilise comme input les textes numérisés par
Gallica et apporte sa
valeur ajoutée : la correction après OCR et la transformation en mode texte
des fichiers images, qui peut être réalisée grâce à l'important travaille
des bénévoles.
Oui, comme le dit Yann ("Europeana ne fera pas de corrections après l'OCR (il
faudrait un budget 10 fois plus important)"), c'est un point important ; il ne
semble pas possible de remplacer le travail de bénévoles sans un gros budget. Donc, cela
semble être un atout considérable pour un projet de bibliothèque numérique. Pour la
diffusion des livres, Wikisource me paraît ainsi supérieur : dans quelques années, et avec
plus de contributeurs, une immense bibliothèque pourra être téléchargée en mode texte ou
distribuée sur DVD, ce qui est difficilement envisageable avec Gallica. D'autres part,
la recherche dans le texte est plus simple et plus précise avec un texte corrigé de
Wikisource, et l'utilisation du mode page permet de constituer un outil de travail
plus souple que Gallica. Par exemple, je fais une thèse sur Nietzsche ; si je cherche un
mot, il me suffit d'ouvrir tous les livres de Nietzsche en même temps et de faire la
recherche avec mon navigateur, tout en étant en mesure de parcourir chaque page rapidement
quand je cherche une référence précise.
En gros, la valeur ajoutée me semble donc être dans le travail "gratuit" des
contributeurs et dans les outils de Wikisource qui offrent de plus larges perspectives :
Wikisource commence par exemple à fournir quelques traductions et des textes lus. Je pense
que Wikisource est actuelement l'outil le plus pratique et le plus complet pour créer
une bibliothèque numérique.
Marc