* Hubert wrote:
Am 13.12.2009 02:44, schrieb Marco Schuster:
Oder delta-based storage zu nutzen. Ähnliche Effekte in Sachen Platzverbrauch würden LiquidThreads oder die direkte Einbindung einer dedizierten Forensoftware bringen, ganz zu schweigen davon, dass diese verf***ten :::-Einrückungen endlich mal wegfielen. Ganz klasse wäre natürlich eine heise-basierte Bedienung: Posts und Replys schön sauber getrennt und strukturiert.
Mit Verlaub, muss ich jetzt, um das oben zu verstehen, einen extra Dienstleistungsvertrag mit Dir abschließen, oder gehts auch massenkompatibler?
Marco bezieht sich darauf wie Artikeldaten von der MediaWiki Software gespeichert werden. In einer normalen Forensoftware speichert man jeden Beitrag einzeln, bei einer Anzeige des Diskussionsstrang setzt man die Beiträge dann zusammen. Der Speicherbedarf ist also Länge * Anzahl.
Ähnlich verhält es sich bei der Differenzspeicherung, da wird für jede Änderung nur gespeichert, was sich tatsächlich verändert hat. Bei einer forenähnlichen Umgebung wie Diskussionsseiten in der Wikipedia läuft das auch wieder darauf hinaus, jeden Beitrag einzeln zu erfassen, die Grösse ist wieder circa Länge * Anzahl.
MediaWiki speichert jedoche jede Version vollständig; wenn ein Artikel in jeder Version um ein Zeichen wächst, speichert man für die n-te Ver- sion n Zeichen plus soviel wie man für die vorherige Version braucht (und deren Vorgäner und so weiter), das ist grob n*n, gut das n-fache von dem was bei Differenz- bzw. strukturierter Speicherung anfällt.
Praktisch kann man das gut nachvollziehen wenn man einen Artikel über Special:Export mit allen Versionen exportiert, und das Ergebnis dann mit gzip packt. Das so zu machen muss im übrigen kein Problem sein, was man an Platz verschenkt mag durch weniger Verwaltungsaufwand gern wieder reinkommen.