[Wikide-l] Wikipedia-Inhalte knuddeln und drucken...
Agon S. Buchholz
asb at kefk.net
Mo Mär 21 23:42:45 UTC 2005
Matthias Walliczek wrote:
> Warum Technik, wenn es auch anders geht? Die meisten Artikel sind
> doch so gegliedert, dass in der Einleitung zuerst die Definition +
> Kurzfassung des sonstigen Inhalts kommt und erst danach die
> ausführliche Darstellung.
> Wenn man diese Gliederung beibehält bzw. bei allen Artikeln einbaut
> (und das wird bei der Exzellenten-Diskussion und im Review ja
> gemacht), dann kann jeder die Informationen finden, die er sucht.
Darum geht es nicht; Uli beschrieb ein ganz anderes Problem, das Du so
nicht lösen kannst, nämlich die Trennung zwischen den Komplexen
"zentrale Information" und "Hintergrundinformation/ Gelaber". Uli
beklagte die Zunahme von letzterem und artikulierte das Bedürfnis, die
Komponente "zentrale Information" separat zu verwenden. Würde man Ulis
Problem genau darauf reduzieren, wäre ein Fork m.E. nicht erforderlich,
sondern eine kleine Modifikation der Software ausreichen.
Jeder Parser müsste raten, ob der definitorische Absatz einen, zwei oder
mehr Absätze umfasst, oder man müsste per Konvention festlegen, dass der
definitorische Abschnitt immer den gesamten Text bis zur ersten
Überschrift umfasst etc.
So lange die Software kein semantisches Verständnis über die exakte
Artikelstruktur hat, ist es unmöglich, gezielt auf Teile des
Artikelbestandes zuzugreifen. Unabhängig von der o.g. Problemstellung
hätte eine solche Trennung auch andere Vorteile, beispielsweise die
Möglichkeit der vollautomatischen Generierung von thematischen
Glossaren, beispielsweise basierend auf Kategorien.
MfG -asb