[WikiFR-l] Wikisource : la question piège ?

Yann Forget yann at forget-me.net
Mer 28 Mar 18:49:39 UTC 2007


La suite.

Yann

-------- Message original --------
Sujet: 	Re: [Wikisource-l] Wikisource : la question piège ?
Date: 	Wed, 28 Mar 2007 18:49:46 +0200
De: 	François Rey

Oui, je suis d'accord avec Marc et Yann. Gallica offre une quantité de
livres, mais l'accès y est difficile et de faibles possibilités de
recherche en mode "texte". Les outils de recherche de Wikisource sont
pour l'instant interessants mais assez faibles, et ils pourraient être
largement améliorés sans pour autant avoir à toucher à la structure de
la base de données (exemples : recherche dans une "arborescence" d'un
auteur, ou d'une catégorie, ...). Je ne suis pas sûr que la base de
données de Gallica soit aussi souple.

Pour l'instant, Gallica n'offre aucune garantie de qualité de ses livres
en mode "texte", et ne pourra jamais les offrir (voir l'aveu dans les
pages d'aide d'Europeana). Aussi, les utilisateurs sont obligés de
basculer du mode image au mode texte (plus facilement sur Europeana que
sur Gallica, bien que sur Europeana il y ait déjà des erreurs
d'indexation, voir par exemple /Au service de la France/ de Raymond
Poincaré) ; et surtout, les utilisateurs sont obligés de faire EUX-MEMES
les corrections nécessaires, ce qui coûte d'autant plus cher que
l'extrait recherché est long ! Sur Wikisource, nous pouvons offrir une
grande qualité (et donc pas d'obligations à corriger soi-même des textes
peut-être déjà corrigés par d'autres !), qui, en plus et contrairement à
Wikipedia, est indiscutable, à partir du moment où la source est connue
et accessible de tous. C'est d'ailleurs notre objectif d'offrir aux
lecteurs de Wikisource un accès à cette source de référence.

Il faut voir aussi que Wikisource n'est pas, comme Gallica, une
bibliothèque française, mais une bibliothèque de textes en français,
avec, cerise sur le gateau (et la cerise est belle, croyez-moi !), des
liens vers les mêmes textes écrits en d'autres langues ; voire les mêmes
textes écrits dans d'autres versions, en français ancien versus français
moderne, ..., et que des outils de comparaison existent (et peuvent
encore être améliorés) pour permettre de lire en parallèle les
différentes versions.

François.

Marc Galli a écrit :
>> Message du 28/03/07 16:29>
>   
>> donc WS utilise comme input les textes numérisés par Gallica et apporte sa
>> valeur ajoutée : la correction après OCR et la transformation en mode texte
>> des fichiers images, qui peut être réalisée grâce à l'important travaille
>> des bénévoles.
>>     
>
> Oui, comme le dit Yann ("Europeana ne fera pas de corrections après l'OCR (il faudrait un budget 10 fois plus important)"), c'est un point important ; il ne semble pas possible de remplacer le travail de bénévoles sans un gros budget. Donc, cela semble être un atout considérable pour un projet de bibliothèque numérique. Pour la diffusion des livres, Wikisource me paraît ainsi supérieur : dans quelques années, et avec plus de contributeurs, une immense bibliothèque pourra être téléchargée en mode texte ou distribuée sur DVD, ce qui est difficilement envisageable avec Gallica. D'autres part, la recherche dans le texte est plus simple et plus précise avec un texte corrigé de Wikisource, et l'utilisation du mode page permet de constituer un outil de travail plus souple que Gallica. Par exemple, je fais une thèse sur Nietzsche ; si je cherche un mot, il me suffit d'ouvrir tous les livres de Nietzsche en même temps et de faire la recherche avec mon navigateur,
 
> tout en étant en mesure de parcourir chaque page rapidement quand je cherche une référence précise.
>
> En gros, la valeur ajoutée me semble donc être dans le travail "gratuit" des contributeurs et dans les outils de Wikisource qui offrent de plus larges perspectives : Wikisource commence par exemple à fournir quelques traductions et des textes lus. Je pense que Wikisource est actuelement l'outil le plus pratique et le plus complet pour créer une bibliothèque numérique.
>
> Marc

-- 
http://www.non-violence.org/ | Site collaboratif sur la non-violence
http://www.forget-me.net/ | Alternatives sur le Net
http://fr.wikipedia.org/ | Encyclopédie libre
http://fr.wikisource.org/ | Bibliothèque libre
http://wikilivres.info | Documents libres
-------------- section suivante --------------
Un texte encapsulé et encodé dans un jeu de caractères inconnu a été nettoyé...
Nom : file:///tmp/nsmail.asc
Url : http://lists.wikimedia.org/pipermail/wikifr-l/attachments/20070328/a5896340/attachment.asc 


Plus d'informations sur la liste de diffusion WikiFR-l