Hallo!
Um den Bildbestand von Commons zu erweitern und damit die einzelnen Sprachen-Wikipedias noch attraktiver zu machen möchte Directmedia die Bilder und die dazugehörende Datenbank der DVD-ROM "10.000 Meisterwerke der Malerei" [1] zum Upload zur Verfügung stellen.
Es handelt sich um 10.000 Scans von gemeinfreien Werken (Maler ist seit mindestens 70 Jahren tot). Die Datenbank erfasst dazu bei jedem Werk den Dateinamen, den Maler (mit Personendaten wie in der WP), den deutschen Bildtitel, das Entstehungsdatum, die Maße, die Maltechnik, den Ausstellungsort sowie eine grobe stilistische Einordnung ("Barock"). Die Bilder sind hochauflösend mit durchschnittlichen Höhen/Breiten von ca. 1.800 Pixeln im JPG-Format. Die beiden Tabellen (Maler und Werke) liegen als einfache Tab-getrennte Dateien vor.
Die Wikipedia-DVD Herbst 2005 soll von dieser Aktion durch eine reichere Bebilderung profitieren. Bei vielen der 1.600 vertretenen Malern auf der DVD (Schnittmenge mit WP unklar) können sinnvolle Bilder (nicht überbildern!) eingefügt werden. Andererseits, und wichtiger, sollen auf der DVD auch die verknüpften Kategorien samt Bilder [2] von Commons mit aufgenommen werden.
Lizenztechnisch gesehen würde Directmedia vom Hersteller "The Yorck Project Gesellschaft für Bildarchivierung GmbH" die Rechte an der Datenbank (siehe UrhG § 87) erwerben und sie als solche unter die GFDL stellen. Falls letzters lizenztechnisch nicht möglich ist (?), muss ein sinngemäßes Konstrukt gefunden werden.
Voraussetzung dafür ist, dass sich eine kleine "Task Force" in der Community bildet, die den Transfer technisch effizient und inhaltlich sauber durchführt. Außer der reinen Datenlieferung kann Directmedia dazu leider aus Kapazitätsgründen nichts beitragen.
Sollte jemand das Angebot interessant finden, müsste man eine Projektseite anlegen, zur Mitarbeit über die [Commons-l] aufrufen (dann auf Englisch, das war mir jetzt zu viel) usw.
Viele Grüße
Vlado
Links: [1] http://www.digitale-bibliothek.de/scripts/ts.dll?mp=/art/171 6/ (DVD) [2] http://commons.wikimedia.org/wiki/Claude_Monet Der Link zeigt auf einen jetzigen Commons-Bestand, nicht auf die in Rede stehenden Bilder! [3] http://commons.wikimedia.org/wiki/Category:Artpaint Der jetzige Zustand der Hauptkategorie "Malerei" ist alles andere als befriedigend. [4] http://www.theyorckproject.de/ Bildbestände
Erwin Jurschitza Directmedia Publishing GmbH http://www.digitale-bibliothek.de
Ich finde das ein tolles Angebot, wobei es an lizenztechnischen Problemen hoffentlich nicht scheitern wird.
Klaus Graf
Hallo Erwin,
vielen Dank für das tolle Angebot. Könnt Ihr eine Liste der Dateien mit Bildbeschreibungen im Format wie unter
http://commons.wikimedia.org/wiki/Commons:File_upload_service/de
beschrieben generieren oder mir sie in einem Format schicken, das zumindest die Information "Name und Beschreibung" enthält? Den Transfer kann ich dann relativ leicht mit einem Skript handhaben.
Ich bin im Berlin und kann die Daten ggf. auf DVD abholen, oder auch per DSL herunter laden.
Viele Grüße
Erik
Hi Wikipedianer,
An Direcmedia: ein super Angebot! Danke! Wenn mein Englisch nicht so peinlich schlecht waere, haette ich schon eine Projektseite begonnen.
Erik Moeller schrieb am 04/25/2005 08:51 PM:
vielen Dank für das tolle Angebot. Könnt Ihr eine Liste der Dateien mit Bildbeschreibungen im Format wie unter http://commons.wikimedia.org/wiki/Commons:File_upload_service/de beschrieben generieren oder mir sie in einem Format schicken, das zumindest die Information "Name und Beschreibung" enthält? Den Transfer kann ich dann relativ leicht mit einem Skript handhaben.
Die Liste in diesem Format erstelle ich dir gerne und schnell mit einem kleinen Skript aus den beiden Tabellen von Vlado.
Tschuess, Tim.
Hi,
Tim 'avatar' Bartel schrieb am 04/25/2005 09:49 PM:
An Direcmedia: ein super Angebot! Danke! Wenn mein Englisch nicht so peinlich schlecht waere, haette ich schon eine Projektseite begonnen.
Hab es trotzdem gewagt :-/
http://commons.wikimedia.org/wiki/Commons:10.000_paintings_from_Directmedia
Tschuess, Tim.
Tim 'avatar' Bartel wikipedia@computerkultur.org writes:
Hab es trotzdem gewagt :-/
Auf Commons kannst du auch einfach in deiner Muttersprache schreiben und darauf warten, daß es jemand internationalisiert.
http://commons.wikimedia.org/wiki/Commons:10.000_paintings_from_Directmedia
Der Tausendertrenner ist im Englischen ein Komma ;)
Erik Moeller schrieb:
Den Transfer kann ich dann relativ leicht mit einem Skript handhaben. Ich bin im Berlin und kann die Daten ggf. auf DVD abholen, oder auch per DSL herunter laden.
Hallo Erik,
hier die Adresse und Struktur der Dateien:
http://download.directmedia.de/wikipedia/yorck_10000_kuenstl er.txt http://download.directmedia.de/wikipedia/yorck_10000_werke.t xt
Künstlertabelle:
- Name (Nachname, Vorname) - Alternativnamen - Geburtsdatum - Geburtsort - Sterbedatum - Sterbeort - Wirkungszeit (wenn Gebdat/-ort unklar) - Wirkungsort - Seite (der DVD-Ausgabe, ignorieren)
Werketabelle:
- Künstler (exakt wie in Künstlertabelle) - Dateiname (+.jpg) - Titel (deutscher Originaltitel oder Übersetzung) - Entstehungsjahr - Technik - Maße - Hängungsort - Galerie im Hängungsort - Kommentar (unvollständig) - Land - Stil (unvollständig) - Seite (der DVD-Ausgabe, ignorieren)
Die Bilder selbst sind 4 GB groß, da ist eine DVD sicher besser (private Mail folgt wegen Koordination).
Vor dem Upload muss man sich aber noch viele Gedanken machen. Brainstorming:
- für jeden Künstler eine Kategorie angelegen, dabei beachten, dass man bereits vorhandene nicht überschreibt, ggf. merged.
- Template für ein Werk angelegen, damit die Daten "getaggt" bleiben und man das Erscheinungsbild aller Daten leicht ändern kann. Beispiel:
Title: {{{TITLE}}} Painter: {{{PAINTER}}} usw.
- jeden Datensatz mit Hilfe des Templates anlegen, z.B.
{{PAINTING-DE| TITLE=Ecce Homo |PAINTER=Dürer, Albrecht |YEAR=um 1490-1492 ...}}
- alle Datensätze sind auf Deutsch - wie geht man damit in Commons um? Legt man auch ein {{PAINTING-EN}} an und übersetzt nach und nach die Daten? (Die Sprachenfrage bei Commons ist mir sowieso unklar.)
- automatisch den Lizenzbaustein generieren (siehe andere Mail)
- automatisch einen sprechenden Dateinamen generieren, was sich einfacher anhört als es ist, da die Titel tw. sehr lang sind
- halbautomatische Verknüpfung des Künstlers von de: (en:, ...) zu Commons schaffen, ein kleines Tool ähnlich APPERs Personendatentool wäre schön
...
Ich bitte um Verständnis dafür, dass ich das jetzt nicht auf der Commons-Projektseite ins Reine schreibe, zu viele Baustellen auf einmal.
Viele Grüße
Vlado
Erwin Jurschitza Directmedia Publishing GmbH http://www.digitale-bibliothek.de
Die Frage mit dem Datenbankschutz ist wichtig und sollte von bezahlten Rechtsanwaelten oder "unseren" Juristen vom Portal Recht geklaert werden. Es kann natuerlich auch jemand in die CC-DE-Mailingliste gehen und dort nachfragen - als ich das letzte Mal ein solches Problem vortrug, war die Resonanz null. Wenn jemand anderes die Frage stellt, sieht es vielleicht besser aus.
Es ist meines Wissens bislang nicht geklaert, ob Datenbanken (wie z.B. die Wikipedia als Ganzes) unter eine freie Lizenz gestellt werden koennen, da sich die Lizenzen eigentlich nur auf Werke im Sinne der Urheberrechtsgesetze beziehen und von Haus aus nicht auf die ebenfalls im UrhG geregelten Leistungsschutzrechte. In den USA gibt es beispielsweise keinen Datenbankschutz wie in der EU.
KG
Klaus Graf wrote:
In den USA gibt es beispielsweise keinen Datenbankschutz wie in der EU.
Offenbar *noch* nicht. Wobei mir jemand mal genau http://thomas.loc.gov/cgi-bin/query/z?c108:H.R.3261: erklären müsste.
Besonders weit gediehen ist das noch nicht.
Mathias
Hi Vlado,
ja, die Daten sollten in Template-Form vorliegen. Das kann erstmal ziemlich hackig sein, wichtig ist, dass es für eine spätere Konvertierung maschinenlesbar ist. Mit einem Perl-Skript sollte sich das relativ schnell hinbiegen lassen.
Dateinamen könnten in der Tat das größere Problem sein, ich würde jetzt mal intuitiv auf "Künstlername+DM+laufende Nummer" setzen. Kürze ist hier wichtiger als Erratbarkeit.
Viele Grüße
Erik
Hi Wikipedianer,
Erik Moeller schrieb am 04/26/2005 02:24 PM:
ja, die Daten sollten in Template-Form vorliegen. Das kann erstmal ziemlich hackig sein, wichtig ist, dass es für eine spätere Konvertierung maschinenlesbar ist. Mit einem Perl-Skript sollte sich das relativ schnell hinbiegen lassen.
Hab ich soweit gemacht. Alternativ boete sich an, die Daten in eine SQL-DB zu pruegeln, da man dann die Verknuepfung von mehreren Bildern zu einem Kuenstler nachher vermutlich besser generieren kann.
Tschuess, Tim.
Hi Wikipedianer,
Tim 'avatar' Bartel schrieb am 04/26/2005 03:42 PM:
ja, die Daten sollten in Template-Form vorliegen. Das kann erstmal ziemlich hackig sein, wichtig ist, dass es für eine spätere Konvertierung maschinenlesbar ist. Mit einem Perl-Skript sollte sich das relativ schnell hinbiegen lassen.
Hab ich soweit gemacht. Alternativ boete sich an, die Daten in eine SQL-DB zu pruegeln, da man dann die Verknuepfung von mehreren Bildern zu einem Kuenstler nachher vermutlich besser generieren kann.
Auch getan.
Sowas wie SELECT Name, Titel, Dateiname FROM Kuenstler INNER JOIN Werke ON Kuenstler.Name = Werke.Kuenstler laeuft zwar ohne Indices ziemlich zaeh, aber tut :-)
Tschuess, Tim.
"Erwin Jurschitza" ejurschi@directmedia.de writes:
Werketabelle:
- Künstler (exakt wie in Künstlertabelle)
- Dateiname (+.jpg)
- Titel (deutscher Originaltitel oder Übersetzung)
- Entstehungsjahr
- Technik
- Maße
- Hängungsort
- Galerie im Hängungsort
- Kommentar (unvollständig)
- Land
- Stil (unvollständig)
- Seite (der DVD-Ausgabe, ignorieren)
Was ist hier eigentlich mit "Land" gemeint? Das Land, in dem sich die Galerie befindet oder der Wirkungsplatz des Künstlers?
Erwin Jurschitza wrote:
Um den Bildbestand von Commons zu erweitern und damit die einzelnen Sprachen-Wikipedias noch attraktiver zu machen möchte Directmedia die Bilder und die dazugehörende Datenbank der DVD-ROM "10.000 Meisterwerke der Malerei" [1] zum Upload zur Verfügung stellen.
Große klasse! Und auch Danke an Erik für die Bereiterklärung zum Upload der Daten!
Lizenztechnisch gesehen würde Directmedia vom Hersteller "The Yorck Project Gesellschaft für Bildarchivierung GmbH" die Rechte an der Datenbank (siehe UrhG § 87) erwerben und sie als solche unter die GFDL stellen. Falls letzters lizenztechnisch nicht möglich ist (?), muss ein sinngemäßes Konstrukt gefunden werden.
Falls dies tatsächlich ein Problem darstellt ist das wohl ein Punkt für http://meta.wikimedia.org/wiki/Offene_Rechtsfragen (die Seite befindet sich derzeit in keinem guten Zustand, wäre klasse wenn dort jemand mal aufräumen könnte)
Kurt