[Wikide-l] ToDo: Algoritmus zur URV-identifizierung

Magnus Manske magnus.manske at web.de
Do Feb 26 16:12:13 UTC 2004


Robert Michel wrote:

>Aber Google alleine kann uns bei URV nicht helfen, es gibt pay-per-view 
>Content z.b. xipolis.net genios.de oder Archiv des gedrucken Spiegels, denn 
>wir eigenlich für jedes Diff (Artikeländerung) auf Satzähnlichkeiten 
>abarbeiten müssten, genauso wie wir selber populären Kontent z.B NDR, 
>heise.... archiveren sollten um eine eigene DB mit urheberbehafteten Material 
>zur Prüfung von Beiträgen anlegen können um dann nach 3,7,14,28 Tage
>alle Beiträge mit dem anderen Material automatisch vergleichen lassen könnte.
>
>Der Satuts Quo ist zu subjektiv und fehleranfällig. Gibt es hierzu bereits 
>Entwicklungsideen?
>  
>
Mit dem "Google-Test" tun wir an sich schon mehr, als wir (die 
Wikimedia-Foundation) tun müssen. Die einzige Verpflichtung ist, den 
Text rauszunehmen, wenn der Copyright-Halter an die Tür klopft. Das gilt 
für Online-Foren, und somit auch für wikis.

Abgesehen davon *können* wir pay-per-view-Inhalte gar nicht checken, per 
definitionem (wir sind ja nicht verpflichtet, nur deshalb den 
Spiegel-Zugang zu kaufen:-)

Etwas gelegentliches googlen und ein offenes Auge für "hochqualitative" 
Texte, besonders bein anons, sollte die meisten URVs rausfiltern.

Magnus