[Wikide-l] ToDo: Algoritmus zur URV-identifizierung
Magnus Manske
magnus.manske at web.de
Do Feb 26 16:12:13 UTC 2004
Robert Michel wrote:
>Aber Google alleine kann uns bei URV nicht helfen, es gibt pay-per-view
>Content z.b. xipolis.net genios.de oder Archiv des gedrucken Spiegels, denn
>wir eigenlich für jedes Diff (Artikeländerung) auf Satzähnlichkeiten
>abarbeiten müssten, genauso wie wir selber populären Kontent z.B NDR,
>heise.... archiveren sollten um eine eigene DB mit urheberbehafteten Material
>zur Prüfung von Beiträgen anlegen können um dann nach 3,7,14,28 Tage
>alle Beiträge mit dem anderen Material automatisch vergleichen lassen könnte.
>
>Der Satuts Quo ist zu subjektiv und fehleranfällig. Gibt es hierzu bereits
>Entwicklungsideen?
>
>
Mit dem "Google-Test" tun wir an sich schon mehr, als wir (die
Wikimedia-Foundation) tun müssen. Die einzige Verpflichtung ist, den
Text rauszunehmen, wenn der Copyright-Halter an die Tür klopft. Das gilt
für Online-Foren, und somit auch für wikis.
Abgesehen davon *können* wir pay-per-view-Inhalte gar nicht checken, per
definitionem (wir sind ja nicht verpflichtet, nur deshalb den
Spiegel-Zugang zu kaufen:-)
Etwas gelegentliches googlen und ein offenes Auge für "hochqualitative"
Texte, besonders bein anons, sollte die meisten URVs rausfiltern.
Magnus