hi Da Björn Hoehrmann dankenswerter Weise einmal einen Tag die SLAs mitprotokolliert hat und mir das Ergebnis (genauer: komplette Liste der schnellgelöschten Artikel in Erstversion mit Inhalt und Löschlog) überlassen hat, habe ich einmal diese aufgedröselt. Erhebungszeitraum ist 25. bis 26.11. 12:50 UTC.
- insgesamt wurden 674 Seiten im Artikelraum schnellgelöscht. - davon sind 573 indiskutabler Müll. Also Selbstdarstellungen von Schülern, wirre Zeichenfolgen und ähnliches. Beschimpfungen habe ich davon 5 protokolliert, keine ist klar zuzuordnen. Dazu ein offensichtlicher Fake einer Gemeinde in D. - drei Seiten waren irgendwelche Texte in falscher Sprache (je einmal englisch, spanisch und ungarisch). - 20 mal lebt der Artikel unter einem anderen Lemma weiter, hier wurden nur Verschiebeleichen gelöscht. - 7 Artikel haben im Benutzerraum überlebt und harren dort der Überarbeitung. Mindestens einer davon (der Aufhänger der ganzen Sache hier) ist inzwischen zurück. - 6 Seiten wurden als unbrauchbare URVs gelöscht (wo ich nicht immer mit dem "Unbrauchbar" einverstanden bin). - 3 Seiten sind jetzt Redirects (waren jeweils redundante Artikel), zwei davon habe ich eben selbst als solche erst erstellt. - eine Seite landete im Humorarchiv. - eine Seite wurde als "Babelfish-Unfall" gelöscht (ich halte ihn für rettbar). Bleiben also genau 60 Seiten, die die Bezeichnung "ernsthafter Versuch eines Artikels" verdienen. Weder die Relevanzkriterien (die teilweise sehr offensichtlich unterlaufen werden) noch die Artikelqualität (Hauptproblem: Werbung) sind dabei berücksichtigt.
Insgesamt ist so eine Liste von 69 Begriffen entstanden, deren Löschung meiner Meinung nach nicht unter die Vandalismusbekämpfung fällt. Hierunter sind allerdings auch einige Firmen und Sportvereine, deren Nichterfüllung der Relevanzkriterien teilweise recht eindeutig ist. Gestrichen ist der einzige (!) Wiedergänger des Tages. Zahlreiche der unten genannten sind mit "kein Artikel", einige sogar als "Unfug" gelöscht worden.
*Fevmar *InterMedia Solutions [Werbung] *Fahrbare Weidehütte [Werbung] *Fleischrasierer *Vorgelegemotor *Sprühschnee [viel Klamauk drin] *Ret-Protoonkogen [Könnte Quatsch sein] *Kaltabreise [Markaber] *FC Ehekirchen *Bengalische Quitte [jaja, die Biologen werden mich lynchen, dass ich den aufliste..] *Laukaitis & Kapfer [Werbung] *Drift City [Browserspiel, etwas werbend] *Newark (New York) [mit offensichtlichen sachlichen Fehlern, aber dass ein Artikel angebracht ist, ist klar erkennbar] *Schöner Sportclub DSC *Cheaptickets [Werbung] *Nona Tyson *Charles Williams (US-amerikanischer Schriftsteller) *Screening (Wirtschaftswissenschaft) *Vicky Chase *Help! 7 Song Radio Sampler *Dead Rabbids *Gerhard Jantzen *VDA QMC [Werbung] *Isolierklinker [Werbung] *Konrad Guhl *DAVID GmbH - Software. Systeme. Lösungen. [Werbung] *Robert Pfleger *Rompel, Georg *Jens Alder *Kent Johansson *Zendesk [Werbung] *Floriano Sauer *Uelde [ein Dorf in D] *Frank Nopper *Emre Gülec [Profifußballer?] *BellandDual GmbH *Melrose Place (2009) *Schlagzeuger matthias rumpf *Gustaf Larson [wenn der Substub nicht lügt, der Firmengründer von Volvo!] *Markus Hoffmann. [Nicht identisch mit der unter dem Lemma ohne Punkt vorhandenen Person] *Peter Tigges *FC Bechlingen *Stefan Dösselmann *Blair Witch Project: The Beginning *Penagina *SV Blau Weiss Petershagen Eggersdorf *Disklavier [Werbung] *Josef Schöpf *Surprise (heftli) [Inzwischen am Ziel angekommen] *Toxic Smile *Hartford (Michigan) *Borjgali *Kofuz *Leon Fromkess *TSV Mühlenfeld *Gröninger Privatbrauerei [Werbung] *Johanniskirche (Klein Berkel) *Hajener landbrot [Werbung] *Hitex Development Tools [Werbung] *HiTOP [Werbung] *Oldenburg (Texas) [Schon zahlreiche Male gelöscht worden, sollte man einmal als Artikelwunsch betrachten] *Reichs-Straßenverkehrsordnung [nur Gesetzestext] *Google Bilder *Hasselbrink-Schule *B+S Banksysteme [Werbung] *Konsoldierungshilfe *Kamado *Milchindustrie-Verband e.V. [Werbung] *W&co MediaServices [Werbung]
moin
On 03.12.2009, at 06:40, Kai F. Lahmann wrote:
hi Da Björn Hoehrmann dankenswerter Weise einmal einen Tag die SLAs mitprotokolliert hat und mir das Ergebnis (genauer: komplette Liste der schnellgelöschten Artikel in Erstversion mit Inhalt und Löschlog) überlassen hat, habe ich einmal diese aufgedröselt. Erhebungszeitraum ist 25. bis 26.11. 12:50 UTC.
- insgesamt wurden 674 Seiten im Artikelraum schnellgelöscht.
[...]
Insgesamt ist so eine Liste von 69 Begriffen entstanden, deren Löschung meiner Meinung nach nicht unter die Vandalismusbekämpfung fällt. Hierunter sind allerdings auch einige Firmen und Sportvereine, deren Nichterfüllung der Relevanzkriterien teilweise recht eindeutig ist. Gestrichen ist der einzige (!) Wiedergänger des Tages. Zahlreiche der unten genannten sind mit "kein Artikel", einige sogar als "Unfug" gelöscht worden.
hmm soll man jetzt sagen:
"Gut das es nur 10% an diskutablen SLAs sind" oder doch lieber "10% sind schon zuviel und zeigen einen gewissen grad an unfähigkeit der durchführenden" ?
mich verwundert es. zum einen finde ich 10% schon deutlich zuviel, zum anderen hätte ich gedacht das es deutlich mehr sind.
alles im allen ein herzliches danke für den einblick!
ich vermute mal das ganze war schon mit einen erheblichen arbeitsaufwand verbunden, aber dennoch würde mich interessieren ob es ein konstanter wert ist oder nur zufall. sprich ist es möglich das mal über eine woche oder zu machen?
cu assetburned
assetburned schrieb:
mich verwundert es. zum einen finde ich 10% schon deutlich zuviel, zum anderen hätte ich gedacht das es deutlich mehr sind.
Ich hatte eigentlich eher noch weniger erwartet (oder erhofft?). Die Zahl reduziert sich natürlich noch um die Artikel, die für _uns_ offensichtlich irrelevant sind, für den Autor aber nicht (also etwa die recht zahlreichen Sportvereine oder die "Gelbe Seiten"-Einträge). Die gerne geunkten Artikel über das eigene Haustier und ähnliches sind mir dagegen nicht begegnet, Wörterbuch-Artikel über von einer Clique selbst erfundenen Worten diesmal auch nicht (kenne ich sonst aber zur Genüge). Unter "Müll" sind übrigens auch die "XY ist die coole Band von Fritz und Egon, die jetzt krasse Z-Musik macht" sowie die Werbe-Einträge, die nur die Bezeichnung "SPAM" verdienen.
ich vermute mal das ganze war schon mit einen erheblichen arbeitsaufwand verbunden, aber dennoch würde mich interessieren ob es ein konstanter wert ist oder nur zufall. sprich ist es möglich das mal über eine woche oder zu machen?
Möglich ist es. Nur muss man sich dann eben fast 5000 "Artikel" ansehen - und das ist dann doch recht nervig.
Hallo!
Kannst du deine Untersuchung nochmal etwas anders aufbereiten für die Reform der Löschregeln. Und zwar konkret, wieviele Anträge mit der Begründung "zweifelsfrei Irrelevant" gestellt wurden, vielleicht auch wieviele davon unberechtigt. Auch bzgl. anderer Begründungen wäre das interessant. Das Ergebnis am Besten gleich auf die Disk des MB oder eine eigene Unterseite.
Danke Alex
-----Ursprüngliche Nachricht----- Von: wikide-l-bounces@lists.wikimedia.org [mailto:wikide-l-bounces@lists.wikimedia.org]Im Auftrag von Kai F. Lahmann Gesendet: Donnerstag, 3. Dezember 2009 06:40 An: Mailingliste der deutschsprachigen Wikipedia Betreff: [Wikide-l] Analyse der Schnelllöschungen
hi Da Björn Hoehrmann dankenswerter Weise einmal einen Tag die SLAs mitprotokolliert hat und mir das Ergebnis (genauer: komplette Liste der schnellgelöschten Artikel in Erstversion mit Inhalt und Löschlog) überlassen hat, habe ich einmal diese aufgedröselt. Erhebungszeitraum ist 25. bis 26.11. 12:50 UTC.
- insgesamt wurden 674 Seiten im Artikelraum schnellgelöscht. - davon sind 573 indiskutabler Müll. Also Selbstdarstellungen von Schülern, wirre Zeichenfolgen und ähnliches. Beschimpfungen habe ich davon 5 protokolliert, keine ist klar zuzuordnen. Dazu ein offensichtlicher Fake einer Gemeinde in D. - drei Seiten waren irgendwelche Texte in falscher Sprache (je einmal englisch, spanisch und ungarisch). - 20 mal lebt der Artikel unter einem anderen Lemma weiter, hier wurden nur Verschiebeleichen gelöscht. - 7 Artikel haben im Benutzerraum überlebt und harren dort der Überarbeitung. Mindestens einer davon (der Aufhänger der ganzen Sache hier) ist inzwischen zurück. - 6 Seiten wurden als unbrauchbare URVs gelöscht (wo ich nicht immer mit dem "Unbrauchbar" einverstanden bin). - 3 Seiten sind jetzt Redirects (waren jeweils redundante Artikel), zwei davon habe ich eben selbst als solche erst erstellt. - eine Seite landete im Humorarchiv. - eine Seite wurde als "Babelfish-Unfall" gelöscht (ich halte ihn für rettbar). Bleiben also genau 60 Seiten, die die Bezeichnung "ernsthafter Versuch eines Artikels" verdienen. Weder die Relevanzkriterien (die teilweise sehr offensichtlich unterlaufen werden) noch die Artikelqualität (Hauptproblem: Werbung) sind dabei berücksichtigt.
Insgesamt ist so eine Liste von 69 Begriffen entstanden, deren Löschung meiner Meinung nach nicht unter die Vandalismusbekämpfung fällt. Hierunter sind allerdings auch einige Firmen und Sportvereine, deren Nichterfüllung der Relevanzkriterien teilweise recht eindeutig ist. Gestrichen ist der einzige (!) Wiedergänger des Tages. Zahlreiche der unten genannten sind mit "kein Artikel", einige sogar als "Unfug" gelöscht worden.
*Fevmar *InterMedia Solutions [Werbung] *Fahrbare Weidehütte [Werbung] *Fleischrasierer *Vorgelegemotor *Sprühschnee [viel Klamauk drin] *Ret-Protoonkogen [Könnte Quatsch sein] *Kaltabreise [Markaber] *FC Ehekirchen *Bengalische Quitte [jaja, die Biologen werden mich lynchen, dass ich den aufliste..] *Laukaitis & Kapfer [Werbung] *Drift City [Browserspiel, etwas werbend] *Newark (New York) [mit offensichtlichen sachlichen Fehlern, aber dass ein Artikel angebracht ist, ist klar erkennbar] *Schöner Sportclub DSC *Cheaptickets [Werbung] *Nona Tyson *Charles Williams (US-amerikanischer Schriftsteller) *Screening (Wirtschaftswissenschaft) *Vicky Chase *Help! 7 Song Radio Sampler *Dead Rabbids *Gerhard Jantzen *VDA QMC [Werbung] *Isolierklinker [Werbung] *Konrad Guhl *DAVID GmbH - Software. Systeme. Lösungen. [Werbung] *Robert Pfleger *Rompel, Georg *Jens Alder *Kent Johansson *Zendesk [Werbung] *Floriano Sauer *Uelde [ein Dorf in D] *Frank Nopper *Emre Gülec [Profifußballer?] *BellandDual GmbH *Melrose Place (2009) *Schlagzeuger matthias rumpf *Gustaf Larson [wenn der Substub nicht lügt, der Firmengründer von Volvo!] *Markus Hoffmann. [Nicht identisch mit der unter dem Lemma ohne Punkt vorhandenen Person] *Peter Tigges *FC Bechlingen *Stefan Dösselmann *Blair Witch Project: The Beginning *Penagina *SV Blau Weiss Petershagen Eggersdorf *Disklavier [Werbung] *Josef Schöpf *Surprise (heftli) [Inzwischen am Ziel angekommen] *Toxic Smile *Hartford (Michigan) *Borjgali *Kofuz *Leon Fromkess *TSV Mühlenfeld *Gröninger Privatbrauerei [Werbung] *Johanniskirche (Klein Berkel) *Hajener landbrot [Werbung] *Hitex Development Tools [Werbung] *HiTOP [Werbung] *Oldenburg (Texas) [Schon zahlreiche Male gelöscht worden, sollte man einmal als Artikelwunsch betrachten] *Reichs-Straßenverkehrsordnung [nur Gesetzestext] *Google Bilder *Hasselbrink-Schule *B+S Banksysteme [Werbung] *Konsoldierungshilfe *Kamado *Milchindustrie-Verband e.V. [Werbung] *W&co MediaServices [Werbung]
-- Kai F. Lahmann
_______________________________________________ WikiDE-l mailing list WikiDE-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikide-l
* Alexander Juhrich wrote:
Kannst du deine Untersuchung nochmal etwas anders aufbereiten für die Reform der Löschregeln. Und zwar konkret, wieviele Anträge mit der Begründung "zweifelsfrei Irrelevant" gestellt wurden, vielleicht auch wieviele davon unberechtigt. Auch bzgl. anderer Begründungen wäre das interessant. Das Ergebnis am Besten gleich auf die Disk des MB oder eine eigene Unterseite.
Also den Wortlaut der Schnelllöschanträge, so es welche gab, habe ich damals nicht gespeichert (es ist zu aufwändig alle paar Sekunden zu gucken ob ein neuer Artikel verändert wurde, und im Nachhinein haben nur Administratoren und ähnlich priviligierte auf die Daten zugriff). Was die Löschbegründung der Administratoren angeht lassen sich die über die API und wahrscheinlich auch die Spezialseiten nachvollziehen, z.B. über
http://de.wikipedia.org/w/api.php?action=query&list=logevents&letype...
Damit kann man auch aktuelle Löschungen nachvollziehen. Ich hatte unter
http://lists.wikimedia.org/pipermail/wikide-l/2009-December/022659.html
schonmal eine kurze Auswertung angegeben im Vergleich zu Löschungen in der englischsprachigen Wikipedia, allerdings von einem anderen, jedoch ähnlich grossem, Datensatz. Ich hab in dem Thread auch angemerkt, wenn man was wegen der Schnelllöschungen machen möchte, dann sollte man die Suchfunktion so überarbeiten, dass man von da aus nicht mehr direkt auf die "Neuer Artikel"-Maske kommt. Wie ich in
http://lists.wikimedia.org/pipermail/wikide-l/2009-December/022631.html http://lists.wikimedia.org/pipermail/wikide-l/2009-December/022653.html
darstelle, lässt sich der Schnelllöschbetrieb ohnehin wegautomatisieren ohne nennenswerte Reibungsverluste, und wie man im Löschmonitor sieht
http://loeschmonitor.appspot.com/
ist der reguläre Löschbetrieb auch nicht weiter sinnvoll, wenn alles be- halten würde, was die Löschdiskussion einen Tag lang übersteht, stünde die Wikipedia auch nicht wirklich schlechter da; wobei ich da zugegebe- nermassen etwas erstaunt bin, dass dieser 7-Tage-Mythos fern ab der Re- alität liegt.