Moin! Erstmal danke für die zahlreichen Reaktionen auf meinen Bot-Vorschlag! Ich will den Bot so machen, dass er über Spezial:Randompage eine Seite/Minute abruft(zum einen will ich den Wiki-Server nicht überlasten, zum anderen lasssen SQL dumps meine kiste abstürzen(512mb RAM, AMD Athlon XP1800+)). Auf der besagten Steuerseite(z.B. Benutzer:Fragenmensch/RegBot) können nur Admins und ich Änderungen machen.Der Bot zieht sich jede Betriebsstunde einen Klon(das können auch IPs mit "Quelltext einsehen") und parst jede Seite durch die regulären Ausdrücke, sendet sie und schreibt diese Aktion in sein Logbuch. Zum Format: Ich würde einen regulären Ausrduck z.B. so aufbauen: ^(.+)ä(.+)$ ==> $1ä$2 Die Syntax ist hier mal genau die von mod_rewrite(für den Apache). Dann mal die voraussichtlichen Daten: Seiten/Stunde: 60 Betriebszeit: ca. 2h täglich Seiten/Tag: ca. 120-140 Vielleicht richte ich dann auch noch eine Steuerungsseite auf Wiki ein, von der sich der Bot dann eine Kopie pro Tag zieht und aus der seine Seiten/Stunde-Quote liest. Aber schaumer erstmal dasss der Bot fertig wird(Danke übrigens für den pywikibot-Tip, ich habs nach 6 stunden Herumgespiele mit AutoIt auegeben)
Marco
PS: Wie macht Ihr es eigentlich, dass Ihr immer nur bestimmte Posts der Mail beantwortet??
Hallo Marco!
Moin! Erstmal danke für die zahlreichen Reaktionen auf meinen Bot-Vorschlag! Ich will den Bot so machen, dass er über Spezial:Randompage eine Seite/Minute abruft(zum einen will ich den Wiki-Server nicht überlasten, zum anderen lasssen SQL dumps meine kiste abstürzen(512mb RAM, AMD Athlon XP1800+)).
Verstehe ich es richtig, dass der Bot irgendwelche zufälligen Seiten aufrufen soll und in diesen dann Ersetzungen durch reguläre Ausdrücke vornimmt? Ich verstehe nicht ganz den Nutzen, wenn nur zufällige Seiten ausgewählt werden.
Auf der besagten Steuerseite(z.B. Benutzer:Fragenmensch/RegBot) können nur Admins und ich Änderungen machen.Der Bot zieht sich jede Betriebsstunde einen Klon(das können auch IPs mit "Quelltext einsehen") und parst jede Seite durch die regulären Ausdrücke, sendet sie und schreibt diese Aktion in sein Logbuch. Zum Format: Ich würde einen regulären Ausrduck z.B. so aufbauen: ^(.+)ä(.+)$ ==> $1ä$2 Die Syntax ist hier mal genau die von mod_rewrite(für den Apache). Dann mal die voraussichtlichen Daten: Seiten/Stunde: 60 Betriebszeit: ca. 2h täglich Seiten/Tag: ca. 120-140 Vielleicht richte ich dann auch noch eine Steuerungsseite auf Wiki ein, von der sich der Bot dann eine Kopie pro Tag zieht und aus der seine Seiten/Stunde-Quote liest.
Vielen Dank für dein Engagement, aber ich glaube du erliegst der (manchmal auch bei mir selbst beobachteten) Informatikerkrankheit, alles mit möglichst automatischen Systemen und Abstraktionsebenen erledigen zu wollen. Irgendwo muss aber noch ein Mensch bei der Sache sein, der den Überblick darüber und Verantwortung dafür hat, was eigentlich geschieht.
Nochmal:
Wenn du die Regulären Ausdrücke und ihre Auswirkungen manuell überprüfst und die Verantwortung über alle Edits des Bots übernimmst, ist der Bot ein schönes Hilfsmittel.
Wenn die Regulären Ausdrücke ungeprüft übernommen werden (ob sie von Admins kommen ist dabei unerheblich) und auf irgendwelche zufälligen Artikel angewandt werden, ist der Bot ein unverantwortlicher Irrläufer.
Bots sind wie Telemedizin (Operationen, die per Fernsteuerung über Netzverbindung ausgeführt werden).
gruß, Jakob
PS: Wie macht Ihr es eigentlich, dass Ihr immer nur bestimmte Posts der Mail beantwortet??
P.S: Kannst du die Frage nochmal genauer formulieren?
Jakob Voss jakob.voss@nichtich.de schrieb am Thu, 05 May 2005 00:19:36 +0200:
Wenn du die Regulären Ausdrücke und ihre Auswirkungen manuell überprüfst und die Verantwortung über alle Edits des Bots übernimmst, ist der Bot ein schönes Hilfsmittel.
Die Auswahl zufälliger Artikel ist bei der Artikelanzahl einfach nicht zu machen. Du bräuchtest zum Beispiel ein halbes Jahr, wenn du pro Minute einen zufälligen Artikel holst und wer weiß, wieviele doppelt sind und wieviele Artikel in dem halben Jahr existieren... Ein Bot ohne Datenbankanbindung kann eigentlich maximal bei Interwiki-Links nützlich sein. Ansonsten ist eine Artikelauswahl anhand eines Dumps unerlässlich. (Übrigens auch bei Interwiki-Bots... Artikel ohne solche brauchen ja nicht geprüft werden...)
Und auch dann kann ein Bot (fast) nichts, automatisch machen, wie Jakob das schon sagt.
PS: Wie macht Ihr es eigentlich, dass Ihr immer nur bestimmte Posts der Mail beantwortet??
P.S: Kannst du die Frage nochmal genauer formulieren?
Vermutlich liest er nicht die Liste in der üblichen Form, dass jede Mail extra eintrudelt, sondern bekommt den täglichen Digist. Und das ist auch schon die Antwort auf die Frage: Wir bekommen jede Mail einzeln (weil wir das so eingestellt haben - ist meiner Meinung nach auch die Standardoption bei der Anmeldung) und beantworten sie dann. Daher antworten wir manchmal auch öfter am Tag ;).
MfG Christian Thiele (APPER)
Marco S. wrote:
Erstmal danke für die zahlreichen Reaktionen auf meinen Bot-Vorschlag! Ich will den Bot so machen, dass er über Spezial:Randompage eine Seite/Minute abruft(zum einen will ich den Wiki-Server nicht überlasten, zum anderen lasssen SQL dumps meine kiste abstürzen(512mb RAM, AMD Athlon XP1800+)).
Du wirst den Server schon nicht überlasten, wenn du [[Spezial:Randompage]] öfter aufrufst (das ist schließlich nur eine Lese-Operation). Du solltest vielleicht nur die Edits auf 1 pro Minute beschränken. Algorithmisch bedeutet das also: Rufe [[Spezial:Randompage]] so lange immer wieder auf, bis du eine Seite findest, auf die irgendeine Regexp matcht, und bearbeite sie dann und warte eine Minute. Das ist nur ein Vorschlag ;-).
Ich würde einen regulären Ausrduck z.B. so aufbauen: ^(.+)ä(.+)$ ==> $1ä$2 Die Syntax ist hier mal genau die von mod_rewrite(für den Apache).
Ich hoffe sehr stark, daß das nur ein Beispiel war, um das Format zu beschreiben. Ich wäre auf keinen Fall damit einverstanden, wenn du sinnloserweise alle nicht-ASCII-Zeichen durch HTML-Entities ersetzt. (Außerdem wird im obigen Beispiel das erste und letzte Zeichen jedes Artikels außer Acht gelassen...)
Timwi
Hi! Timwi schrieb:
Marco S. wrote:
Erstmal danke für die zahlreichen Reaktionen auf meinen Bot-Vorschlag! Ich will den Bot so machen, dass er über Spezial:Randompage eine Seite/Minute abruft(zum einen will ich den Wiki-Server nicht überlasten, zum anderen lasssen SQL dumps meine kiste abstürzen(512mb RAM, AMD Athlon XP1800+)).
Du wirst den Server schon nicht überlasten, wenn du [[Spezial:Randompage]] öfter aufrufst (das ist schließlich nur eine Lese-Operation). Du solltest vielleicht nur die Edits auf 1 pro Minute beschränken. Algorithmisch bedeutet das also: Rufe [[Spezial:Randompage]] so lange immer wieder auf, bis du eine Seite findest, auf die irgendeine Regexp matcht, und bearbeite sie dann und warte eine Minute. Das ist nur ein Vorschlag ;-).
Ich würde einen regulären Ausrduck z.B. so aufbauen: ^(.+)ä(.+)$ ==> $1ä$2 Die Syntax ist hier mal genau die von mod_rewrite(für den Apache).
Ich hoffe sehr stark, daß das nur ein Beispiel war, um das Format zu beschreiben. Ich wäre auf keinen Fall damit einverstanden, wenn du sinnloserweise alle nicht-ASCII-Zeichen durch HTML-Entities ersetzt. (Außerdem wird im obigen Beispiel das erste und letzte Zeichen jedes Artikels außer Acht gelassen...)
Nun, es war WIRKLICH nur ein beispiel... aber ich kenn mich bisher nur mit mod_rewrite aus..und eigentlich steht da ja ^ für den beginn des strings und $ fürs ende des strings aber es dürfte nicht sooo schwer sein, den Bot einzusetzen, zum Beispiel, wennn ein Artikel verschoben wird, dass der Artikel dann auf der Botseite eingetragen wird(hmmm da müsste man MediaWiki ändern glaube ich) und der bot dann alle Links auf diesen Artikel ändert...
Timwi
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Cu, ~~~~
PS:Hat jemand von Euch schonmal nen Bot mit Auto-it geschrieben(mit pywikipediabot komm ich noch weniger zurecht, irgendwie fehlt mir da ne README) und kann mir da helfen???
Marco S. wrote:
Marco S. wrote:
Ich würde einen regulären Ausrduck z.B. so aufbauen: ^(.+)ä(.+)$ ==> $1ä$2 Die Syntax ist hier mal genau die von mod_rewrite(für den Apache).
Timwi schrieb:
(Außerdem wird im obigen Beispiel das erste und letzte Zeichen jedes Artikels außer Acht gelassen...)
Nun, es war WIRKLICH nur ein beispiel... aber ich kenn mich bisher nur mit mod_rewrite aus..und eigentlich steht da ja ^ für den beginn des strings und $ fürs ende des strings
Was Timwi meinte, ist, dass du die + durch * ersetzen müsstest, aber darum geht es hier ja auch gar nicht.
aber es dürfte nicht sooo schwer sein, den Bot einzusetzen, zum Beispiel, wennn ein Artikel verschoben wird, dass der Artikel dann auf der Botseite eingetragen wird(hmmm da müsste man MediaWiki ändern glaube ich) und der bot dann alle Links auf diesen Artikel ändert...
Du versuchst hier wirklich, das Rad neu zu erfinden; der Python-Bot kann schon seit Ewigkeiten Redirects auflösen.
Gruß Daniel