Matthias Walliczek wrote:
Warum Technik, wenn es auch anders geht? Die meisten Artikel sind doch so gegliedert, dass in der Einleitung zuerst die Definition + Kurzfassung des sonstigen Inhalts kommt und erst danach die ausführliche Darstellung. Wenn man diese Gliederung beibehält bzw. bei allen Artikeln einbaut (und das wird bei der Exzellenten-Diskussion und im Review ja gemacht), dann kann jeder die Informationen finden, die er sucht.
Darum geht es nicht; Uli beschrieb ein ganz anderes Problem, das Du so nicht lösen kannst, nämlich die Trennung zwischen den Komplexen "zentrale Information" und "Hintergrundinformation/ Gelaber". Uli beklagte die Zunahme von letzterem und artikulierte das Bedürfnis, die Komponente "zentrale Information" separat zu verwenden. Würde man Ulis Problem genau darauf reduzieren, wäre ein Fork m.E. nicht erforderlich, sondern eine kleine Modifikation der Software ausreichen.
Jeder Parser müsste raten, ob der definitorische Absatz einen, zwei oder mehr Absätze umfasst, oder man müsste per Konvention festlegen, dass der definitorische Abschnitt immer den gesamten Text bis zur ersten Überschrift umfasst etc.
So lange die Software kein semantisches Verständnis über die exakte Artikelstruktur hat, ist es unmöglich, gezielt auf Teile des Artikelbestandes zuzugreifen. Unabhängig von der o.g. Problemstellung hätte eine solche Trennung auch andere Vorteile, beispielsweise die Möglichkeit der vollautomatischen Generierung von thematischen Glossaren, beispielsweise basierend auf Kategorien.
MfG -asb