[Wikide-l] Hilferuf aus dem Maschinenraum

Bjoern Hoehrmann derhoermi at gmx.net
So Dez 13 13:27:30 UTC 2009


* Hubert wrote:
>Am 13.12.2009 02:44, schrieb Marco Schuster:
>> Oder delta-based storage zu nutzen. Ähnliche Effekte in Sachen
>> Platzverbrauch würden LiquidThreads oder die direkte Einbindung einer
>> dedizierten Forensoftware bringen, ganz zu schweigen davon, dass diese
>> verf***ten :::-Einrückungen endlich mal wegfielen.
>> Ganz klasse wäre natürlich eine heise-basierte Bedienung: Posts und Replys
>> schön sauber getrennt und strukturiert.

>Mit Verlaub, muss ich jetzt, um das oben zu verstehen, einen extra
>Dienstleistungsvertrag mit Dir abschließen, oder gehts auch
>massenkompatibler?

Marco bezieht sich darauf wie Artikeldaten von der MediaWiki Software
gespeichert werden. In einer normalen Forensoftware speichert man jeden
Beitrag einzeln, bei einer Anzeige des Diskussionsstrang setzt man die
Beiträge dann zusammen. Der Speicherbedarf ist also Länge * Anzahl.

Ähnlich verhält es sich bei der Differenzspeicherung, da wird für jede
Änderung nur gespeichert, was sich tatsächlich verändert hat. Bei einer
forenähnlichen Umgebung wie Diskussionsseiten in der Wikipedia läuft
das auch wieder darauf hinaus, jeden Beitrag einzeln zu erfassen, die
Grösse ist wieder circa Länge * Anzahl.

MediaWiki speichert jedoche jede Version vollständig; wenn ein Artikel
in jeder Version um ein Zeichen wächst, speichert man für die n-te Ver-
sion n Zeichen plus soviel wie man für die vorherige Version braucht
(und deren Vorgäner und so weiter), das ist grob n*n, gut das n-fache
von dem was bei Differenz- bzw. strukturierter Speicherung anfällt.

Praktisch kann man das gut nachvollziehen wenn man einen Artikel über
Special:Export mit allen Versionen exportiert, und das Ergebnis dann
mit gzip packt. Das so zu machen muss im übrigen kein Problem sein,
was man an Platz verschenkt mag durch weniger Verwaltungsaufwand gern
wieder reinkommen.
-- 
Björn Höhrmann · mailto:bjoern at hoehrmann.de · http://bjoern.hoehrmann.de
Am Badedeich 7 · Telefon: +49(0)160/4415681 · http://www.bjoernsworld.de
25899 Dagebüll · PGP Pub. KeyID: 0xA4357E78 · http://www.websitedev.de/