"même question j'ai entre les mains un exemplaire de l'édition originale du
http://fr.wikisource.org/wiki/Discours_sur_l%E2%80%99origine_et_les_fondeme…
s_de_l%E2%80%99in%C3%A9galit%C3%A9_parmi_les_hommes
est ce qu'on le numérise en mode image et qu'on place les vignettes en vis à
vis du texte qu'on possède déjà. A quelle résolution ?
Les pages d'intro (gravures titre errata etc) environ 6 pages
La dédicace et la préface font 70 pages
Le discours fait 262 pages.
jeffdelonge"
Bien sûr qu'il faut la numériser si c'est possible ! Il ne semble pas y avoir d'édition de ce texte sur Gallica. Pour la résolution, je numérise en 300pp. Ensuite pour le mode page, il faut créer une page index et voir aussi s'il y a différentes éditions du texte qui pourrait se distinguer les unes des autres.
Marc
Bonjour,
Ce débat est éparpillé sur trois listes, ça devient difficile à suivre.
Certaines réponses n'ont été postées que sur une seule liste.
Il serait souhaitable, à mon avis, qu'il se poursuive sur la liste
wikisource-l uniquement.
Cordialement,
Yann
Emmanuel Engelhart a écrit :
>
> Gallica fournissant des textes en mode image seulement, il est
> impossible de faire une recherche par mots clefs par exemple...
Pour avoir utilisé Gallica à titre "professionnel" (recherche en
histoire), je peux témoigner que c'est pénibilissime à utiliser à cause
du mode image et (à l'époque, je ne sais pas maintenant) de l'interface.
À ce sujet, est-ce que Wikisource accueille seulement du texte brut ou
est-ce qu'on peut y mettre une édition précise (avec les numéros de page
de l'édition originale dans le texte, je veux dire) ? Par exemple
proposer Saint-Simon dans l'édition Boislile avec numéros de page (donc
de manière citable dans un mémoire de recherche) ferait probablement
bondir la popularité du projet auprès de beaucoup de modernistes :-)
S'il y a des notes et des liens vers Wikipédia pour les noms propres
cités ce serait carrément l'orgie…
Dans le même genre, est-ce qu'il y a un dispositif prévu pour accueillir
des documents d'archive (règles de nommage, mécanisme de notes) sous
forme texte ? Par exemple, je veux mettre sur Wikisource des documents
d'archive qui sont cités dans [[Nicolas Fouquet]] : des actes d'achat,
un contrat de mariage, une lettre de Mazarin à Monsieur, une ordonnance,
etc. En pratique, comment est-ce que je fais ? J'appelle chaque document
par son numéro de cote ?
Marie-Lan
--
http://www.non-violence.org/ | Site collaboratif sur la non-violence
http://www.forget-me.net/ | Alternatives sur le Net
http://fr.wikipedia.org/ | Encyclopédie libre
http://fr.wikisource.org/ | Bibliothèque libre
http://wikilivres.info | Documents libres
donc WS utilise comme input les textes numérisés par Gallica et apporte sa
valeur ajoutée : la correction après OCR et la transformation en mode texte
des fichiers images, qui peut être réalisée grâce à l'important travaille
des bénévoles.
Le 28/03/07, Yann Forget <yann(a)forget-me.net> a écrit :
>
> Sébastien Thébault wrote:
> >> Mais la différence principale est que les textes de Wikisource sont
> >> vérifiés et corrigés (en tous cas, c'est l'objectif), et la qualité de
> >> la publication est notée (sources, conformité à l'original,
> >> typographie,
> >> etc.). La qualité des textes de Gutenberg est très aléatoire (une
> >> bonne
> >> partie des textes en français n'ont pas d'accents, ne respectent
> >> pas la
> >> typographie, etc.). Seule une petite partie de Gallica est
> >> disponible en
> >> mode texte, et il n'y a pas de correction après OCR.
> >>
> >> Cordialement,
> >>
> >> Yann
> >
> > À noter qu'Europeana propose/proposera la version texte (mais il y a
> > encore du déchet à l'OCR)
>
> Europeana ne fera pas de corrections après l'OCR (il faudrait un budget
> 10 fois plus important).
>
> Yann
>
>
>
> Message du 28/03/07 16:29
> De : "Pierre Beaudouin" <pierre.beaudouin(a)gmail.com>
> donc WS utilise comme input les textes numérisés par Gallica et apporte sa
> valeur ajoutée : la correction après OCR et la transformation en mode texte
> des fichiers images, qui peut être réalisée grâce à l'important travaille
> des bénévoles.
Oui, comme le dit Yann ("Europeana ne fera pas de corrections après l'OCR (il faudrait un budget 10 fois plus important)"), c'est un point important ; il ne semble pas possible de remplacer le travail de bénévoles sans un gros budget. Donc, cela semble être un atout considérable pour un projet de bibliothèque numérique. Pour la diffusion des livres, Wikisource me paraît ainsi supérieur : dans quelques années, et avec plus de contributeurs, une immense bibliothèque pourra être téléchargée en mode texte ou distribuée sur DVD, ce qui est difficilement envisageable avec Gallica. D'autres part, la recherche dans le texte est plus simple et plus précise avec un texte corrigé de Wikisource, et l'utilisation du mode page permet de constituer un outil de travail plus souple que Gallica. Par exemple, je fais une thèse sur Nietzsche ; si je cherche un mot, il me suffit d'ouvrir tous les livres de Nietzsche en même temps et de faire la recherche avec mon navigateur, tout en étant en mesure de parcourir chaque page rapidement quand je cherche une référence précise.
En gros, la valeur ajoutée me semble donc être dans le travail "gratuit" des contributeurs et dans les outils de Wikisource qui offrent de plus larges perspectives : Wikisource commence par exemple à fournir quelques traductions et des textes lus. Je pense que Wikisource est actuelement l'outil le plus pratique et le plus complet pour créer une bibliothèque numérique.
Marc
Un autre point que j'ai oublié, c'est que Wikisource n'est pas limité à l'édition des textes de Gallica : il faut ajouter Google Livres, et aussi d'autres bibliothèques d'images, comme cette bibliothèque de textes de médecine dont quelqu'un (Philippe je crois) a donné le lien au scriptorium. Et quand les textes ne sont pas disponibles, des contributeurs peuvent eux-mêmes les numériser (je le fais par exemple pour Nietzsche, mais il y a encore toute une bibliothèque de philosophes dont les oeuvres ne sont accessibles qu'en bibliothèque). L'étendue de Wikisource est ainsi potentiellement très large, mais cela reste un potentiel.
Marc
Je me pose une question à propos de Wikisource (et je suis étonné que
personne ne me la pose lors de mes interventions). Mieux vaut se former en
interne pour être capable de répondre à n'importe quelle question ;)
Pourquoi Wikisource serait mieux que Gallica (le projet de bibliothèque
numérique de la Bibliothèque numérique française) ?
~Pyb
Bonjour,
Des critiques sont régulièrement faites aux Wikipédiens et à Wikimédia
France à propos du traitement inégal entre Wikipédia et les autres projets
francophones, à savoir Wiktionary, Wikinews, Wikibooks, Wikiquote,
Wikisource et Wikiversity. J'aimerais éclaircir un peu les choses.
1. Wikipédia est célèbre, les autres projets pas.
C'est un constat, pas un point de vue. Wikipédia est le 10e site le plus
visité en France. Wikipédia est cité dans la presse écrite, des émissions
lui sont consacrées à la radio et on en parle à la télévision. Pourquoi ?
Parce que le projet intéresse, soulève des questions. Et surtout, parce que
le sujet est polémique et qu'il fait vendre. Une candidate socialiste
invente un mot qui se retrouve dans l'encyclopédie ? Un /College/ américain
interdit à ses étudiants la citation de Wikipédia comme source ? Un hoax à
propos de la mort d'un acteur américain has-been circule grâce à Wikipédia ?
C'est de l'événementiel. Ça intéresse la ménagère de moins de 50 ans. Ça
fait vendre. Ça intéresse les journalistes.
2. Wikipédia aussi a du mal à communiquer sur les sujets qui l'intéressent.
Lorsque l'on souhaite communiquer à propos de Wikipédia sur la difficulté de
trouver des images libres, sur la loi DADVSI, sur Gallica qui est peu
coopérative, sur un projet de loi sur la délinquance qui interdit à un
reporter non professionnel de filmer des violences policières, vous croyez
qu'on arrive à se faire entendre ? Ce qui intéresse les journalistes, c'est
le comité éditorial (qui n'existe pas), le comité d'arbitrage (qui n'est pas
le comité éditorial, non) et les administrateurs (qui ne sont pas non plus
le comité éditorial, non...). Ils veulent savoir si (non, pardon, il veulent
savoir « que ») « Wikipédia va manger Google » et que « le cofondateur de
Wikipédia lance une encyclopédie validée et sécurisée. » Le jour où on a une
affaire Seigenthaler sur Wikibooks, je vous assure que la presse parlera du
projet...
3. Wikimédia France promeut tous les projets.
Wikimédia France a pour mission de faire connaître et de soutenir les
projets de diffusion libre de la connaissance, notamment les projets
hébergés par la Wikimedia Foundation. Et c'est ce qu'elle fait du mieux
qu'elle peut. La liste des présentations faites par les membres de
l'association témoigne d'un engagement qui ne concerne pas uniquement
Wikipédia : < http://meta.wikimedia.org/wiki/Presentations/fr> L'association
profite des interviews pour tenter de parler des autres projets, mais (cf
1.) ça n'intéresse pas les journalistes. J'aimerais toutefois que les
efforts faits par les membres pour promouvoir tous les projets soient
reconnus.
4. Une association est le reflet de ses membres.
Et la majorité des membres de Wikimédia France sont des Wikipédiens. Si vous
estimez que les efforts qui sont faits pour promouvoir les autres projets ne
sont pas encore suffisants, je vous invite vraiment à adhérer à
l'association pour dynamiser la promotion du projet qui vous tient à cœur.
Nous serons ravis de vous y aider. Par contre, refuser de s'impliquer et
critiquer a posteriori, je suis pas d'accord. Quand on décide de ne pas
participer à quelque chose, on assume son choix et on ne vient pas se
plaindre ensuite que c'est mal fait.
5. « Engagez-vous ! »
Si vous avez des idées, des suggestions, des projets pour faire connaître et
soutenir les projets francophones, contactez l'association Wikimédia France
(par exemple sur sa liste de discussion <
http://lists.wikimedia.org/mailman/listinfo/wikimediafr-l>) qui sera ravie
de vous apporter son aide.
--
Guillaume Paumier
[[m:User:guillom]]
http://www.wikimedia.org
Wikimédia France souhaite avoir des idées de projets à réaliser.
En voici quatre pour lancer la discussion :
- Numérisation de documents
lesquels en priorité ?
- Concours photo pour faire connaître Wikimedia Commons.
- Faire de nouveaux goodies : clé USB au logo de Wikipédia, tour de cou au
logo de Wikipédia, puzzle 3D si on arrive à faire le logo de Wikipédia en
3D...
- Organiser des réunions entre wikimédiens un peu partout en France
--
Pierre Beaudouin
Président de Wikimédia France
www.wikimedia.fr
Europeana, le prototype français de bibliothèque numérique
Par Marc Rees, rédaction de PC INpact
http://fr.news.yahoo.com/26032007/308/europeana-le-prototype-francais-de-bi…
La bibliothèque numérique européenne ouvre ses portes sous la forme d'un
prototype, Europeana.eu. C'est le prototype de la contribution française à
la
future BNUE. Cette présentation en cours de semaine dernière s'est faite à
l'occasion du Salon du livre. Officiellement, un budget spécifique de 10
millions d'euros va être alloué au profit de l'initiative. L'objectif
premier
sera d'intégrer 100 000 volumes dans la BNUE dès 2007.
Le module devrait être alimenté par des sources de qualité juridique
différentes. Les premières sont libres de droit, car tombées dans le domaine
public par l'effet du temps.
Des négociations devraient s'ouvrir avec les ayants droit, « afin que la
BNUE
puisse s'ouvrir rapidement à des documents sous droits, dans le strict
respect de la propriété intellectuelle » explique le communiqué officiel. Si
Europeana est la première réponse concrète à la bibliothèque numérique de
Google, hors de question de suivre la voie empruntée par le moteur lors de
la
constitution de son fonds.
Europeana se veut être une version bêta à tester et qui sera proposée aux
autres partenaires européens. En parallèle, se poursuivent d'autres projets
voisins comme celui de la modernisation de Gallica (passage d'une
numérisation en mode image au mode texte OCR, qui alimentera également ce
projet français).
À ce jour, quelque 12 000 documents sont en lignes, issus des collections de
la Bibliothèque nationale de France, de la BN de Hongrie (4000 ouvrages) de
celle du Portugal (1000). « Il a pour objectif de tester, sur un volume
significatif de documents numérisés, les fonctions utilisables dans une
bibliothèque numérique (recherche plein texte au sein d'un ouvrage ou d'un
ensemble d'ouvrages, annotation et étiquetage des textes dans des espaces
personnels, etc.) et met en oeuvre une partie des concepts proposés dans une
maquette présentée à l'automne 2006 aux instances politiques ainsi qu'aux
professionnels des bibliothèques. »
Moteur de recherche libre
Outre des classiques (Corneille, Hugo, Rousseau, Shakespeare, Dickens, etc.)
on trouve également des textes moins académiques, précise la BNF comme les
textes de Claune Bernard, les correspondances d'Auguste Comte, les mémoires
de Saint Simon, etc. S'y ajoutent des dictionnaires et autres outils
biographiques
Le prototype est développé à partir de textes issus de la conversion
automatique par logiciel de reconnaissance de caractères. « Cette conversion
est non corrigée et peut comporter par conséquent un certain nombre
d'erreurs » tempère les auteurs du projet. Europeana utilise enfin comme
outil de recherche un logiciel libre de la fondation Apache, Lucene. Le tout
est hébergé à la BNF derrière 26 serveurs (dual core).
--
Guillaume Paumier
[[m:User:guillom]]
http://www.wikimedia.org