Europeana, le prototype français de bibliothèque numérique Par Marc Rees, rédaction de PC INpact http://fr.news.yahoo.com/26032007/308/europeana-le-prototype-francais-de-bib...
La bibliothèque numérique européenne ouvre ses portes sous la forme d'un prototype, Europeana.eu. C'est le prototype de la contribution française à la future BNUE. Cette présentation en cours de semaine dernière s'est faite à l'occasion du Salon du livre. Officiellement, un budget spécifique de 10 millions d'euros va être alloué au profit de l'initiative. L'objectif premier sera d'intégrer 100 000 volumes dans la BNUE dès 2007. Le module devrait être alimenté par des sources de qualité juridique différentes. Les premières sont libres de droit, car tombées dans le domaine public par l'effet du temps.
Des négociations devraient s'ouvrir avec les ayants droit, « afin que la BNUE puisse s'ouvrir rapidement à des documents sous droits, dans le strict respect de la propriété intellectuelle » explique le communiqué officiel. Si Europeana est la première réponse concrète à la bibliothèque numérique de Google, hors de question de suivre la voie empruntée par le moteur lors de la constitution de son fonds.
Europeana se veut être une version bêta à tester et qui sera proposée aux autres partenaires européens. En parallèle, se poursuivent d'autres projets voisins comme celui de la modernisation de Gallica (passage d'une numérisation en mode image au mode texte OCR, qui alimentera également ce projet français).
À ce jour, quelque 12 000 documents sont en lignes, issus des collections de la Bibliothèque nationale de France, de la BN de Hongrie (4000 ouvrages) de celle du Portugal (1000). « Il a pour objectif de tester, sur un volume significatif de documents numérisés, les fonctions utilisables dans une bibliothèque numérique (recherche plein texte au sein d'un ouvrage ou d'un ensemble d'ouvrages, annotation et étiquetage des textes dans des espaces personnels, etc.) et met en oeuvre une partie des concepts proposés dans une maquette présentée à l'automne 2006 aux instances politiques ainsi qu'aux professionnels des bibliothèques. »
Moteur de recherche libre
Outre des classiques (Corneille, Hugo, Rousseau, Shakespeare, Dickens, etc.) on trouve également des textes moins académiques, précise la BNF comme les textes de Claune Bernard, les correspondances d'Auguste Comte, les mémoires de Saint Simon, etc. S'y ajoutent des dictionnaires et autres outils biographiques
Le prototype est développé à partir de textes issus de la conversion automatique par logiciel de reconnaissance de caractères. « Cette conversion est non corrigée et peut comporter par conséquent un certain nombre d'erreurs » tempère les auteurs du projet. Europeana utilise enfin comme outil de recherche un logiciel libre de la fondation Apache, Lucene. Le tout est hébergé à la BNF derrière 26 serveurs (dual core).
wikisource-l@lists.wikimedia.org