On Fri, Apr 16, 2004 at 12:43:27PM +0200, Matthias Richter wrote:
JFTR: Gemeint ist Jason Richey?
ja.
Interessant wäre für die sicher auch unser wiktionary.org http://mail.wikipedia.org/pipermail/wikipedia-l/2004-March/014695.html http://mail.wikipedia.org/pipermail/wikitech-l/2004-April/009355.html
Was für uns interessant wäre ist das "Wort des Tages" [1] täglich abzugrasen. Für die "Fehlenden Artikel" auf der Hauptseite wäre das sehr praktisch. Wäre schön wenn wir diese Liste als XML bekommen und mit dem pyBot dann die Existenz der Artikel überprüfen könnten.
Genügt http://wortschatz.uni-leipzig.de/wort-des-tages/RDF/ hierfür nicht? Dort finden sich gegen 8:00 Uhr jeweils die Wörter des Tages aus den einzelnen Abteilungen als (sehr einfaches aber hoffentlich valides) RSS 2.0. Vorschläge zum besser machen dürfen gern als PM an mich gehen.
Gut verstecken, als frühe Alpha bezeichnen und dann behaupten ich hätte Tomaten auf den Augen ;-) Lässt sich sehr gut gebrauchen, auch wenn ich in der Wochenanzeige bei <description> den gleichen Zähler wie bei den Tagen erwartet habe. Beim Tages-xml steht in <title> das Datum drinnen
Ganz allgemein sollte euer Programm für die Wörter des Tages noch verbessert werden. Nachnamen wie Böttcher haben (in der Wochenübersicht) nichts in den Top-Hits zu suchen. Auch dass Leute wie Cruise oder Elvis ohne Vorname genannt werden ist auch nervig aber erträglich. Plural ist auch keine Stärke des Systems, Ich-AG und Ich-AGs nebeneinander zu sehen tut schon fast weh.
Bei uns kam weiterhin die Frage auf, inwieweit auf der anderen Seite das Interesse besteht, Wikipedia durch Backlinks auf diejenigen Daten aufzuwerten, die wir korpusbasiert berechnet haben, sprich in erster Linie (statistische) Kollokationen und Graphen?
Wir sind kein Wörterbuch. Das Wiktionary existiert jetzt schon für en: fr: und pl: vielleicht kommt ja de: bald dazu. Interessant wäre mit euren Ergebnissen die Verlinkung zwischen den Artikeln der Wikipedia zu verbessern.
Ich werd heut nachmittag noch ein wenig den pyBot programmieren.
ciao, tom