[Wikide-l] Wikipedia-Inhalte knuddeln und drucken...

Agon S. Buchholz asb at kefk.net
Mo Mär 21 23:42:45 UTC 2005


Matthias Walliczek wrote:

> Warum Technik, wenn es auch anders geht? Die meisten Artikel sind
> doch so gegliedert, dass in der Einleitung zuerst die Definition + 
> Kurzfassung des sonstigen Inhalts kommt und erst danach die
> ausführliche Darstellung.
> Wenn man diese Gliederung beibehält bzw. bei allen Artikeln einbaut
> (und das wird bei der Exzellenten-Diskussion und im Review ja
> gemacht), dann kann jeder die Informationen finden, die er sucht.

Darum geht es nicht; Uli beschrieb ein ganz anderes Problem, das Du so 
nicht lösen kannst, nämlich die Trennung zwischen den Komplexen 
"zentrale Information" und "Hintergrundinformation/ Gelaber". Uli 
beklagte die Zunahme von letzterem und artikulierte das Bedürfnis, die 
Komponente "zentrale Information" separat zu verwenden. Würde man Ulis 
Problem genau darauf reduzieren, wäre ein Fork m.E. nicht erforderlich, 
sondern eine kleine Modifikation der Software ausreichen.

Jeder Parser müsste raten, ob der definitorische Absatz einen, zwei oder 
mehr Absätze umfasst, oder man müsste per Konvention festlegen, dass der 
definitorische Abschnitt immer den gesamten Text bis zur ersten 
Überschrift umfasst etc.

So lange die Software kein semantisches Verständnis über die exakte 
Artikelstruktur hat, ist es unmöglich, gezielt auf Teile des 
Artikelbestandes zuzugreifen. Unabhängig von der o.g. Problemstellung 
hätte eine solche Trennung auch andere Vorteile, beispielsweise die 
Möglichkeit der vollautomatischen Generierung von thematischen 
Glossaren, beispielsweise basierend auf Kategorien.

MfG -asb