[Wikide-l] Helfer für Forschungsprojekt
Mathias Schindler
neubau at presroi.de
Mo Mär 7 13:17:41 UTC 2005
Andreas Brändle schrieb:
> Etwa ein drittel der Variabeln sind automatisch erfassbar, was ich auch
> mache. Ab f04 beginnt die manuelle Arbeit.
(das ist jetzt ein IMHO und IANAinformatiker)
j03: automatisierbar
j02: automatisierbar (mit Aufwand)
m01: automatisierbar
m02: automatisierbar
m03: automatisierbar
n01: automatisierbar (mit Aufwand)
n02: automatisierbar
n03: automatisierbar
n04: einigermassen automatisierbar
o - einigermassen automatisierbar
p- einigermassen automatisierbar
Bei a04/05 kommst du bei alten Artikeln an ein Problem, weil die
Versionshistorie nicht völlig komplett ist. Ausserdem hast du ein
weiteres Problem, wenn Artikel in ihrer Historie durch den
BKL/deBKL-Fleischwolf gezogen wurden. Ein weiteres Problem ist, wenn ein
Artikel aus einer anderen wikipedia-Ausgabe übersetzt wurde (zählen dann
die englischen Revisionen mit?). Da sollte es recht viele Beispiele aus
en->de geben.
Vorschlag
a26: Anzahl der Interwikilinks
Aus der Zahl der Interwikilinks lassen sich begrenzt Rückschlüsse zur
Validität von Lemmata ableiten bzw, seeehr begrenzt zur Relevant des
Lemmas in anderen Sprachen.
>> (und ja, natürlich bei vielen Indikatoren ist ein Mensch schneller.
>> f01 und f02 finde ich nirgends konkretisiert, welche Auflagen welches
>> Werkes meinst du?)
>
> Ist auch noch nicht konkretisiert. Wahrscheinlich nehme ich die jeweils
> neusten und ausführlichsten Auflagen. Hast du einen Wunsch?
Naja, bei Brockhaus ist es im Falle der Enzyklopädie die 20. Auflage von
1996-99 (im Herbst kommt der erste Teil der 21. Auflage heraus, das ist
wohl zu spät). Alternativ hast du noch kleinere Werke von Brockhaus zur
Auswahl. Die letzte Meyers-Enzyklopädie kam 1974 heraus. Das, was heute
als Meyers Taschenlexikon aus dem Bibliographischen Institut & F.A.
Brockhaus ankommt, ist da etwas kondensierter. Wenn man das
Meyers-Taschenlexikon nimmt, sollte man sich lieber auch Encarta oder
den Brockhaus-multimedial ansehen, der eine andere Textbasis hat.
> Die Nutzerstatistiken der WP sind nur bis 19. Oktober 2004 erhältlich.
> Dann hat Tim wegen zu hoher Serverlast den Webalizer abgeschaltet.
> Leider kann ich mit den Google-Treffer nicht bis zum 19. Oktober zurück.
Empfinde ich jetzt als Bruch in der Zahlensystematik.
Mathias