Wolfram Gothe wrote:
...noch ne Frage: es gibt doch bestimmt eine Möglichkeit auch Links zu Bildern oder anderen Dateien auf andersprachigen Seiten der Wikipedia zu legen... Wie geht das? Oder muß ich da auch die Bilder noch mal
hochladen
und dann von neuem verlinken??
Letzteres. Denn es gilt (noch?) das Motto: Disk space is cheap. Also von der englischen WP runterladen, ggf. den Titel anpassen und dann wieder bei der deutschen WP hochladen.
Salve,
Am Freitag, 27. Februar 2004 19:31 schrieb Thomas Luft:
Letzteres. Denn es gilt (noch?) das Motto: Disk space is cheap.
Trozdem suboptimal - für einen DB Dump einer Sprache sicherlich sinvoller, aber bedenke den Cache und RAM-Speicher, statt in jeder Wikipedia-db die Bilder parallel abzulegen sollten Bilder Cachefreundlicher verwaltet werden.
Gibt es von den Entwicklern hierzu schon ideen? rob
Robert Michel wrote:
Salve,
Am Freitag, 27. Februar 2004 19:31 schrieb Thomas Luft:
Letzteres. Denn es gilt (noch?) das Motto: Disk space is cheap.
Trozdem suboptimal - für einen DB Dump einer Sprache sicherlich sinvoller, aber bedenke den Cache und RAM-Speicher, statt in jeder Wikipedia-db die Bilder parallel abzulegen sollten Bilder Cachefreundlicher verwaltet werden.
Gibt es von den Entwicklern hierzu schon ideen?
Soweit ich weiß, nein. Die Bilder werden ja momentan als Datei gespeichert, würde eine Speicherung als BLOB das Problem lösen können. Ich stelle mir da eine neue MySQL-Tabelle namens "images" vor, die das Bild als BLOB speichert und dann für alle verfügbaren Sprachen ein ja/nein-Feld enthält. Sprich: wird das Bild verwendet oder nicht. Keine Ahnung, ob das so funktionieren könnte und vor allem wie die Performance von so einer Lösung aussehen würde, aber damit ließe sich dann ein Dump über eine simple SELECT-Abfrage erstellen, der auch die Bilder der jeweiligen Sprache enthält. Problematisch ist dabei sicherlich die Sprache, aber man könnte sich da evtl. auf Englisch einigen. Wie gesagt, nur eine Idee, da ich weder DB- noch Dateisystemexperte bin. Gruß
Thomas
"Robert Michel" skribis:
Am Freitag, 27. Februar 2004 19:31 schrieb Thomas Luft:
Letzteres. Denn es gilt (noch?) das Motto: Disk space is cheap.
Trozdem suboptimal - für einen DB Dump einer Sprache sicherlich sinvoller, aber bedenke den Cache und RAM-Speicher, statt in jeder Wikipedia-db die Bilder parallel abzulegen sollten Bilder Cachefreundlicher verwaltet werden.
Ein Problem ist, dass manchmal Bilder durch andere ("bessere") ersetzt werden - und der Ersetzer überprüft natürlich (wenn überhaupt) gerade mal die Verwendungen der Bilder in seiner eigenen Sprache.
In anderen Sprachen taugen dann auf einmal die Bildunterschriften überhaupt nichts mehr, nur weil jemand das Bild ausgewechselt hat - und dort merkt man das nicht mal ...
Durch die getrennte Verwaltung kann das umgangen werden.
Paul
Salve Paul,
Am Samstag, 28. Februar 2004 18:06 schrieb Paul Ebermann:
Ein Problem ist, dass manchmal Bilder durch andere ("bessere") ersetzt werden
Eine GNU-FDL Veröffendlichung sollte nicht einfach überschreibbar sein, dann gibt es auch kein Problem mehr mit "ersetzen". Im ernst, die größe von Bilder im Vergleich zu Texten macht eine eine intelligente Nutzung zur Cache-optimierung ZWINGEND.
Z.b. als Pantani starb riefen viel Menschne in vielen Sprachen Artikel über ihn auf. Angenommen sein Artikel hätte ein Foto von ihm. Die verschieden Sprachversionen belegen multiplen Cache-Speicher, aber sein Bild könnte in allen Versionen verwendet werden. Gibt es ein 10kB und ein 35kB Bild so sind dies 45kB pro Sprache sind es 15 Sprachen, so ließe sich alleine 630 KB Speicher sparen. Angenommen pro Tag gibt es 100 solcher internationalen Themen, die in vielen Sprachen mehrfach abgerufen werden, dann sind das 63MB.
Klingt nicht aufregend, aber wenn steigende Popularität die Zahl der internationalen Top-Tagesthemen auf 1000 oder mehr anwächsen läßt, so sind dies bereits 630 MB oder mehr.
Dann gibt es auch noch Artikel mit mehreren Aufnahmen ;)
Es ist gut, das Du dieses Problem angesprochen hast aber
Durch die getrennte Verwaltung kann das umgangen werden.
ist eine suboptimale Lösung. ;)
Gruss rob
On Saturday 28 February 2004 17:40, Robert Michel wrote:
Salve,
Am Freitag, 27. Februar 2004 19:31 schrieb Thomas Luft:
Letzteres. Denn es gilt (noch?) das Motto: Disk space is cheap.
Trozdem suboptimal - für einen DB Dump einer Sprache sicherlich sinvoller, aber bedenke den Cache und RAM-Speicher, statt in jeder Wikipedia-db die Bilder parallel abzulegen sollten Bilder Cachefreundlicher verwaltet werden.
Gibt es von den Entwicklern hierzu schon ideen?
Ja, auch wenn es leider an Entwicklern fehlt (mein persönlicher Eindruck, es mag auch andere Gründe haben), die so etwas umsetzen:
http://meta.wikipedia.org/wiki/WikiImages.org#Examples_(to_understand_the_pr...)
wenn ich mich nicht täusche war Fantasy derjenige, der das Subprojekt zumindest angestoßen hat.
Das "diskspace ist cheap" Argument ist ein schlechtes. Wie schon daraufhin gewiesen wurde kostet es im cache deutlich mehr Platz dasselbe Bild 10x abzulegen und cache Platz ist nicht "cheap".
Dazu kommt, dass Arbeitszeit ganz und gar nicht billig ist. Wenn ich ein Bild digital nachbearbeite, z.b. Image:USS Port Royal CG-73.jpg, dann habe ich danach bestimmt nicht Lust jede Wikipedia (en, de, es, ....) darauf abzusuchen ob und unter welchem Namen dieses Bild schon existiert, um es dann gegebenenfalls auch dort hinaufzuladen.
Viele Grüße, Marco
P.S. wer mal das oben angegebene Bild (eng. Wikipedia) mit der vorherigen Version vergleicht wird deutliche Qualitätsunterschiede bemerken. Dies ist dem auf der Seite http://www-sop.inria.fr/odyssee/research/tschumperle-deriche:02d/appliu/inde... vorgestellten Programm zu verdanken. Die dort gezeigten Beispiele sind übrigens sehr beeindruckend. Wer Bilder nachberarbeiten will sollte auf jeden Fall vorbeischauen und sich "image restoration" etc. anschauen.
Marco Krohn marco.krohn@web.de writes:
P.S. wer mal das oben angegebene Bild (eng. Wikipedia) mit der vorherigen Version vergleicht wird deutliche Qualitätsunterschiede bemerken. Dies ist dem auf der Seite http://www-sop.inria.fr/odyssee/research/tschumperle-deriche:02d/appliu/inde... vorgestellten Programm zu verdanken. Die dort gezeigten Beispiele sind übrigens sehr beeindruckend. Wer Bilder nachberarbeiten will sollte auf jeden Fall vorbeischauen und sich "image restoration" etc. anschauen.
Interessant. Müßte man als Gimp-Filter einbauen.
Dies Statement der INRIA-Forscher ist allerdings so nicht haltbar:
The sources are distributed under the GPL Licence, so only non-profit organizations can use it.
Entweder GPL, oder "non-profit only" - beide Bedingungen zusammen funktionieren nicht.