Alwin Meschede schrieb:
Ich habe in den letzten Tagen nochmal Trocken-Experimente mit einem Typokorrektur-Bot angestellt und denke, dass ich die Sache inzwischen ganz gut im Griff habe. Wenn ich dieses Ding jetzt auf die echte Wikipedia loslasse, müssen wir uns aber darüber im Klaren sein, dass der Bot alles korrigieren wird, was ihm vor die Flinte läuft - auf Zitate, Buchtitel, Namen und sonstige Befindlichkeiten kann keine Rücksicht genommen werden. Deshalb werfe ich einfach mal die Frage in den Raum, ob eine automatische Typo-Korrektur (mit allen Nebenwirkungen, die sich daraus ergeben könnten) überhaupt gewünscht ist,
Das Problem ist, dass viele der durch den Bot neu eingefügten Fehler solche sind, die nur sehr schwer erkannt werden (im Gegensatz zu denen, die er korrigiert).
oder ob wir lieber bis zum Wärmetod des Universums mit einer Wikipedia voller Rechtschreibfehler leben wollen,
Das müssen wir nicht. Irgendwann wird es einen externen Wikipedia-Editor (oder MediaWiki-Editor?) geben, der auch eine eingebaute Rechtschreibprüfung hat. Spannende Frage hier natürlich: Wann?
uns dafür aber an der authentischen Schreibung von ein paar Zitaten und einigen Buchtiteln erfreuen wollen - so in etwa wären die Alternativen.
Intakte Zitate, Buchtitel und vor allem Autorennamen sind mir persönlich wichtiger als die korrigierten Rechtschreibfehler. Aber die Präferenzen sind hier sicher unterschiedlich.
Außerdem könnte man auf diesem Wege relativ schmerzfrei die kürzlich diskutierte Umstellung von "z.B." und den inzwischen bereits zahlreich im Wiki auftauchenden  -Konstrukten nach "zum Beispiel" vornehmen
- das wäre eine Sache von ein paar Stunden, dann ist das Thema fürs
erste erledigt.
Unnütze Entities loszuwerden wäre allerdings klasse. Lässt sich abschätzen, ob es hier falsche Positive geben wird?
Da schon absehbar ist, dass obige Maßnahme nur begrenzt wirksam sein wird und der Bot trotz aller Vorsicht mit ziemlicher Sicherheit den einen oder anderen Bock bauen wird, bräuchte es Leute, die dem Bot ein wenig hinterherräumen. Ich denke, dass alle fraglichen Artikel in irgendeiner Beobachtungsliste stehen werden, so dass hoffentlich alle Böcke entdeckt werden und auf die Schnelle wieder korrigiert werden.
Da gibst Du Dich denke ich einer Illusion hin. Aber es wäre mal interessant zu wissen, wie viel Prozent unserer Artikel in mindestens einer (zwei, drei ...) Beobachtungsliste(n) stehen. Und die Prozentzahlen, wenn man nur die in den letzten zwei Wochen aktiven Benutzer nimmt. Wie viele der beobachteten Artikel tatsächlich auch kontrolliert werden lässt sich damit aber noch nicht sagen, ich bspw. schaue mir nur einen Teil der Änderungen an.
So, und jetzt will ich Meinungen dazu hören!
Sorry, aber Rechtschreibkorrektur gehört m.M.n. leider nicht zu den automatisierbaren Tätigkeiten. Aber ließe sich dem Bot-Betreiber vielleicht vor jeder Änderung ein diff anzeigen, dass dann von Hand bestätigt werden muss?
Kurt
P.S.: Werden von einem der Bots eigentlich die Überschriften "Externe Links", "Externe Verweise", "Web-Links", "Links" etc. zu "Weblinks" umgewandelt (entsprechend auch der Singular)?