Oui, je suis d'accord avec Marc et Yann. Gallica offre une quantité de livres, mais l'accès y est difficile et de faibles possibilités de recherche en mode "texte". Les outils de recherche de Wikisource sont pour l'instant interessants mais assez faibles, et ils pourraient être largement améliorés sans pour autant avoir à toucher à la structure de la base de données (exemples : recherche dans une "arborescence" d'un auteur, ou d'une catégorie, ...). Je ne suis pas sûr que la base de données de Gallica soit aussi souple.

Pour l'instant, Gallica n'offre aucune garantie de qualité de ses livres en mode "texte", et ne pourra jamais les offrir (voir l'aveu dans les pages d'aide d'Europeana). Aussi, les utilisateurs sont obligés de basculer du mode image au mode texte (plus facilement sur Europeana que sur Gallica, bien que sur Europeana il y ait déjà des erreurs d'indexation, voir par exemple Au service de la France de Raymond Poincaré) ; et surtout, les utilisateurs sont obligés de faire EUX-MEMES les corrections nécessaires, ce qui coûte d'autant plus cher que l'extrait recherché est long ! Sur Wikisource, nous pouvons offrir une grande qualité (et donc pas d'obligations à corriger soi-même des textes peut-être déjà corrigés par d'autres !), qui, en plus et contrairement à Wikipedia, est indiscutable, à partir du moment où la source est connue et accessible de tous. C'est d'ailleurs notre objectif d'offrir aux lecteurs de Wikisource un accès à cette source de référence.

Il faut voir aussi que Wikisource n'est pas, comme Gallica, une bibliothèque française, mais une bibliothèque de textes en français, avec, cerise sur le gateau (et la cerise est belle, croyez-moi !), des liens vers les mêmes textes écrits en d'autres langues ; voire les mêmes textes écrits dans d'autres versions, en français ancien versus français moderne, ..., et que des outils de comparaison existent (et peuvent encore être améliorés) pour permettre de lire en parallèle les différentes versions.

François.

Marc Galli a écrit :
Message du 28/03/07 16:29
De : "Pierre Beaudouin" <pierre.beaudouin@gmail.com>
    

  
donc WS utilise comme input les textes numérisés par Gallica et apporte sa
valeur ajoutée : la correction après OCR et la transformation en mode texte
des fichiers images, qui peut être réalisée grâce à l'important travaille
des bénévoles.
    

Oui, comme le dit Yann ("Europeana ne fera pas de corrections après l'OCR (il faudrait un budget 10 fois plus important)"), c'est un point important ; il ne semble pas possible de remplacer le travail de bénévoles sans un gros budget. Donc, cela semble être un atout considérable pour un projet de bibliothèque numérique. Pour la diffusion des livres, Wikisource me paraît ainsi supérieur : dans quelques années, et avec plus de contributeurs, une immense bibliothèque pourra être téléchargée en mode texte ou distribuée sur DVD, ce qui est difficilement envisageable avec Gallica. D'autres part, la recherche dans le texte est plus simple et plus précise avec un texte corrigé de Wikisource, et l'utilisation du mode page permet de constituer un outil de travail plus souple que Gallica. Par exemple, je fais une thèse sur Nietzsche ; si je cherche un mot, il me suffit d'ouvrir tous les livres de Nietzsche en même temps et de faire la recherche avec mon navigateur, 
tout en étant en mesure de parcourir chaque page rapidement quand je cherche une référence précise.

En gros, la valeur ajoutée me semble donc être dans le travail "gratuit" des contributeurs et dans les outils de Wikisource qui offrent de plus larges perspectives : Wikisource commence par exemple à fournir quelques traductions et des textes lus. Je pense que Wikisource est actuelement l'outil le plus pratique et le plus complet pour créer une bibliothèque numérique.

Marc


_______________________________________________
Wikisource-l mailing list
Wikisource-l@lists.wikimedia.org
http://lists.wikimedia.org/mailman/listinfo/wikisource-l
  

---------------------------------------------------------------------------------------
Orange vous informe que cet e-mail a été contrôlé par l'anti-virus mail.
Aucun virus connu à ce jour par nos services n'a été détecté.