Andreas Brändle schrieb:
Etwa ein drittel der Variabeln sind automatisch erfassbar, was ich auch mache. Ab f04 beginnt die manuelle Arbeit.
(das ist jetzt ein IMHO und IANAinformatiker)
j03: automatisierbar j02: automatisierbar (mit Aufwand)
m01: automatisierbar m02: automatisierbar m03: automatisierbar
n01: automatisierbar (mit Aufwand) n02: automatisierbar n03: automatisierbar n04: einigermassen automatisierbar
o - einigermassen automatisierbar p- einigermassen automatisierbar
Bei a04/05 kommst du bei alten Artikeln an ein Problem, weil die Versionshistorie nicht völlig komplett ist. Ausserdem hast du ein weiteres Problem, wenn Artikel in ihrer Historie durch den BKL/deBKL-Fleischwolf gezogen wurden. Ein weiteres Problem ist, wenn ein Artikel aus einer anderen wikipedia-Ausgabe übersetzt wurde (zählen dann die englischen Revisionen mit?). Da sollte es recht viele Beispiele aus en->de geben.
Vorschlag a26: Anzahl der Interwikilinks
Aus der Zahl der Interwikilinks lassen sich begrenzt Rückschlüsse zur Validität von Lemmata ableiten bzw, seeehr begrenzt zur Relevant des Lemmas in anderen Sprachen.
(und ja, natürlich bei vielen Indikatoren ist ein Mensch schneller. f01 und f02 finde ich nirgends konkretisiert, welche Auflagen welches Werkes meinst du?)
Ist auch noch nicht konkretisiert. Wahrscheinlich nehme ich die jeweils neusten und ausführlichsten Auflagen. Hast du einen Wunsch?
Naja, bei Brockhaus ist es im Falle der Enzyklopädie die 20. Auflage von 1996-99 (im Herbst kommt der erste Teil der 21. Auflage heraus, das ist wohl zu spät). Alternativ hast du noch kleinere Werke von Brockhaus zur Auswahl. Die letzte Meyers-Enzyklopädie kam 1974 heraus. Das, was heute als Meyers Taschenlexikon aus dem Bibliographischen Institut & F.A. Brockhaus ankommt, ist da etwas kondensierter. Wenn man das Meyers-Taschenlexikon nimmt, sollte man sich lieber auch Encarta oder den Brockhaus-multimedial ansehen, der eine andere Textbasis hat.
Die Nutzerstatistiken der WP sind nur bis 19. Oktober 2004 erhältlich. Dann hat Tim wegen zu hoher Serverlast den Webalizer abgeschaltet. Leider kann ich mit den Google-Treffer nicht bis zum 19. Oktober zurück.
Empfinde ich jetzt als Bruch in der Zahlensystematik.
Mathias