Hallo!
Marco Krohn schrieb:
Von dem, was ich bisher beobachtet habe, würde ich die Anzahl der Artikel, die eine URV beinhalten auf 0,1% - 1,0% schätzen. Bei 100.000 Artikeln macht das 100 - 1000 URVs.
Das wäre dramatisch hoch. Vielen Dank für deine Bemühungen bisher in dieser Richtung, ich halte das Thema für sehr wichtig.
Vor diesem Hintergrund erscheint es mir sehr gefährlich eine CD mit Wikipedia Inhalten zu produzieren, ohne dass nicht wenigstens das Ausmaß der möglichen URVs anhand einer Stichprobe abgeschätzt wurde.
Während des (inzwischen abgeschlossenen) Endreviews wurden Texte und Bilder getrennt behandelt:
- Bei Texten wurden alle zur Verfügung stehenden Listen abgearbeitet. Texte, die dabei nicht gelöscht wurden, kommen auf die CD.
- Bei Bildern musste aus Platzgründen sowieso eine Auswahl getroffen werden. Deshalb wurden ca. 5.000 Bilder positiv ausgewählt, d.h. auf der CD sind nur klare Fälle vertreten.
Viele Grüße
Vlado
Erwin Jurschitza Directmedia Publishing GmbH http://www.digitale-bibliothek.de