Hallo Liste,
wieder mal eine Bitte um Kommentare zu einem etwas komplizierten Thema; Ausgangspunkt sind wieder mal Benennungsprobleme einerseits von Artikeln, andererseits von Links; konkrete Einzelfälle, die längere Zeit diskutiert wurden, sind den Listenteilnehmern sicherlich noch in Erinnerung, daher hier nur ein paar allgemeine Beispiele:
* Fremdsprachige Namen und Latinisierungen wie [[Avicenna]] = Abu Ali al-Husain ibn Abdallah ibn Sina = ??? ???? * aktuelle und historische Städte-, Regions oder Ländernamen, die sich im Lauf der zeit geändert haben bzw. die von den jeweils ansässigen Ethnien nicht eindeutig benannt werden; * Buch- und Filmtitel (Originaltitel, deutscher Titel, Neuauflagen, Umtitelungen usw.) * Abkürzungen und Akronyme (siehe Diskussion unter [[http://de.wikipedia.org/wiki/Wikipedia_Diskussion:Namenskonventionen/Abk%FCr...]]) sowie ganz allgemein * Synonyme, Quasisynonyme, Homonyme und Polyseme; hierzu nur ein paar Beispiele, die wir i.d.R. mit Begriffsklärungsseiten und ggf. Qualifikatoren (Zusatz in Klammern) lösen würden: ** Synonyme: [[UN]], [[UNO]] und [[Vereinte Nationen]]; [[Otto-Motor]], [[Ottomotor]]; [[Myopie]], [[Kurzsichtigkeit]]; ** Quasisynonyme: [[Wohnen]], [[Wohnung]] ** Homonyme: Auch das Ersetzen von Bedeutungsteilen durch Synonyme ist unschön; z.B. [[Boxen]], [[Boxsport]] und [[Stereoboxen]]. ** Homonyme mit Qualifikator: [[Tenor]] -> [[Tenor (Stimmlage)]], [[Tenor (Urteil)]] ** Polyseme: [[Fuchs]]; [[Leitung]]; [[Verfahren]]; [[System]]; [[Schirm]] usw.
Gerade bei den Homonymen werden wir mit wachsender Artikelzahl zunehmend Nomenklaturprobleme bekommen (warum beispielsweise "Tenor (Urteil)" und nicht "Tenor (Recht)"?).
Die derzeitige Handhabung besteht darin, (a) erstmal zuzusehen was passiert und dann, wenn genügend Wikipedianer Handlungsbedarf sehen, (b) irgendwann anzufangen, Regeln zu kodifizieren; dann (c) mehr oder weniger darauf zu achten, dass die Regeln eingehalten werden und vielleicht (d) die Regeln zu modifizieren und dann (e) wieder mit Aufräumen anzufangen.
Das Problem bei dieser Vorgehensweise besteht darin, dass * teilweise irrationale Entscheidungen zu Regeln gefällt werden, * Artikel möglicherweise in einer Form betitelt sind, die nur begrenzt konsensfähig ist und daher immer wieder zum Gegenstand von Diskussionen oder Umbenennungen wird (beispielsweise kürzlich [[Benutzer:Arnapha]] bei den arabischen Themen), * eine nicht besonders wiki-gemäße Tendenz zur Überregulierung entsteht; eine gewisse Regulierung ist notwendig, weil weder eine automatische Terminologiekontrolle möglich ist, noch der reine Selbstlauf konstruktiv ist, daher entstehen immer mehr (präzise) Regeln und Ausnahmen oder (unpräzise) Regeln und Debatten; * in Folge von (b) ff. werden m.E. unnötig "(Human-) Ressourcen" vergeudet, die anderweitig konstruktiver genutzt werden könnten.
M.E. ist es unproduktiv, Debatten über die "richtige" Benennung eines Artikels zu führen oder manuell für die regelgetreue Bennenung sorgen zu müssen, wenn es dafür technische Lösungen gibt.
Die Problematik von *eindeutigen* Bezeichnern stammt aus der Zeit der bibliothekarischen Zettelkästen, wo man halt wenig Flexibilität hatte und Bücher nicht mehrfach katalogisieren konnte. Wir haben diese materiellen Probleme dank EDV nicht mehr, daher würde ich mich gerne von diesen überkommenen Notwendigkeiten trennen.
Ich möchte hiermit eine Diskussion über eine *technische* Lösung anregen, die die oben genannten Probleme m.E. vollständig beseitigt und die Handhabung erheblich vereinfacht; der Ansatz basiert auf einer einfachen Synonymverwaltung mit kleinen Anlehnungen an den Thesaurus aus dem IuD-Bereich.
Vorschlag zur Diskussion:
Der vorgeschlagene Ansatz besteht darin, die eindeutige Zuordnung von *einem* Artikel zu *genau einem* Artikeltitel aufzuheben. Damit wäre eine Änderung des Datenmodells erforderlich, die aber m.E. den Nutzen absolut aufwiegen würde.
Ich stelle mir den technischen Ablauf in etwa folgendermassen vor (ich freue mich dabei über Korrekturen oder Ergänzungen, dieser Vorschlag soll nur als Diskussionsgrundlage dienen):
* Das "Titel"-Feld wird normalisiert von der Relation 1:1 (ein Artikeltitel zu einem Artikeltext) zu n:1 (n Artikeltitel zu einem Artikeltext). * Der Artikel bekommt eine ID-Nummer ("ID-Artikel"), die möglichen Artikeltitel ("ID-Artikeltitel") ebenfalls; über eine Verknüpfungstabelle werden "ID-Artikeltitel" mit "ID-Artikel" verbunden. * [Optional]: Der Artikeltitel bekommt noch ein zusätzliches Freitext-Beschreibungsfeld ("latinisierter Name", "Bezeichnung der Stadt bis 1945" usw.)
In der Praxis würde das dann folgendermassen funktionieren:
* Alle Lemmata werden gleichbehandelt; [[Avicenna]] ist gleichwertig mit [[Abu Ali al-Husain ibn Abdallah ibn Sina]] (evl. könnte man hier auch noch Interwiki-Links wie [[en:Avicenna]] und andere /zukünftige) Verwaltungsinformationen wie Kategorien aus dem Artikelquelltext auslagern; das wäre aber eine separate Diskussion) * Als Lemma zum Artikel wird jeweils genau das angezeigt, was verlinkt wurde bzw. was der Benutzer in der "Go"-Box eingetippt hat; Autoren können so gezielt das Lemma beeinflussen, das angezeigt wird, und suchende Benutzer werden nicht durch eventuelle Redirect-Titel verwirrt. * Wer auf einen latiniierten Namen verlinken will kann das gezielt tun, wer auf den arabischen Namen verlinken will kann das ebenfalls tun; der Titel des Link-Ziels spiegelt das verlinkte Lemma automatisch wieder. * Wir sparen jede Menge Redirects auf synonyme Bedeutungen, die werden sauber in die "Artikeltitel"-Tabelle ausgelagert. * Unter dem jeweils erscheinenden (Haupt-) Lemma werden in einem speziellen Feld in etwas kleinerer Schrift die synonymen Artikeltitel aufgelistet, ggf. mit dem optionalen Beschreibungsfeld in Klammern () dahinter. * Im Editor-Interface wird einfach ein zusätzliches Feld ("synonymer Artikeltitel", bzw. "aka") angezeigt, mit einem Kontrollelement wie beispielsweise [+] kann ein weiteres Synonymfeld ergänzt werden. * [Optional]: Möglicherweise können Begriffsklärungen automatisiert angelegt werden; Artikel sind als Entitäten durch ihre ID-Nummer eindeutig, sobald also in der Tabelle ID-Artikeltitel zwei oder mehr identische Einträge auftauchen, könnte automatisch eine Begriffsklärungsseite generiert werden.
Da der *Artikelgegenstand* durch die ID-Artikeltext jetzt eine eindeutige Entität ist, bekommen wir auf elegante Weise eine eindeutige begriffliche Klarheit, ohne beispielsweise manuell Redirects auf veränderte Lemmata korrigieren zu müssen.
Diese Lösung würde m.E. sämtliche Diskussionen über das "richtige" oder "übliche" oder "sinnvolle" Lemma ein für alle Mal vom Tisch schaffen, nicht nur für Abkürzungen sondern für alle eindeutigen "Dinge" (Artikelgegenstände) mit multiplen Bezeichnungen.
Offene Fragen und potenzielle Probleme:
* Ist eine technische Realisierung mit dem derzeitigem Code ohne enormen Aufwand möglich? * Vermutlich gibt es einen zusätztlichen DB-Overhead für zusätzliche Abfragen; ist er marginal, d.h. bewegt er sich im Rahmen dessen, was Redirects verursachen, oder verursacht er *signifikante* Performance-Einbußen? * Die Normalisierung des Datenmodells wird vielleicht als wenig Wiki-like empfunden, weil halt ein wenig relationale Datenmodellierung erforderlich ist; m.E. überwiegen aber die wiki-mäßigen Gewinne was die Freiheit der Benennung und die Reduktion von Regularien angeht. * Eine ganze Menge manuelle Aufräumarbeit wären erforderlich, bis die Synonymverwaltung wirklich zum Tragen kommt; eventuell könnte man aber beispielsweise durch einen Bot mit Benutzereingriff die Redirects auslesen und -- nach manueller Prüfung durch einen Editor -- direkt in die Synonymverwalung einfließen lassen.
Nachteile dieser Lösung:
* Eine Änderung des Datenmodells wäre erforderlich, die für MediaWiki programmiert werden muß, d.h. es müssen sich Entwickler finden und ein gewisser internationaler Konsens müsste erzielt werden;
MfG -asb