Links in die weite Welt...

List overview All Threads
Download

newer

older

FYI: Belohnung ausgelobt, warum...

Brockhaus entwickelt ein neues...

Mathias Schindler

8 Jan 2006 8 Jan '06

11:12 p.m.

Hi,

ich habe eben ein wenig mit dem letzten artikeldump von download.wikimedia.org gespielt und angefangen, hyperlinks aus den Artikeln zu extrahieren. URLs, die als Templates entstehen (wikinews, imdb und so) werden so erstmal nicht erkannt. Einige URLs sehen von der Struktur eher unmöglich aus.

328212 erkannte URLs

154746 erkannte urls aus .de 64532 erkannte eindeutige domain-namen aus .de

2189 Links nach juris.de 1163 Links nach heise.de 1149 Links nach spiegel.de 1128 Links nach google.de 826 Links nach zeit.de 379 Links nach bund.de 372 Links nach taz.de 120 Links nach jungewelt.de 30 Links nach wikiweise.de 26 Links nach wissen.de 10 Links nach brockhaus.de

Show replies by date

Joerg-Olaf Schaefers

9 Jan 9 Jan

12:23 a.m.

Hallo Mathias,

Sunday, January 8, 2006, 11:12:51 PM, you wrote:

...

Hi,

...

ich habe eben ein wenig mit dem letzten artikeldump von download.wikimedia.org gespielt und angefangen, hyperlinks aus den Artikeln zu extrahieren.

[...]

...

2189 Links nach juris.de 1163 Links nach heise.de 1149 Links nach spiegel.de

Wobei sich imo schon ganz allgemein die Frage stellt, welchen Sinn es in einem Projekt, das sich der Freien und nachhaltigen Verbreitung von Wissen verschrieben hat, Artikel von Anbietern zu verlinken, die ihr "Wissen" in Bezahlarchiven verstecken.

ciao Olaf

Mathias Schindler

12:29 a.m.

On 1/9/06, Joerg-Olaf Schaefers listen@fx3.de wrote:

...

Wobei sich imo schon ganz allgemein die Frage stellt, welchen Sinn es in einem Projekt, das sich der Freien und nachhaltigen Verbreitung von Wissen verschrieben hat, Artikel von Anbietern zu verlinken, die ihr "Wissen" in Bezahlarchiven verstecken.

Ein Teil davon geht nach gutenberg.spiegel.de.

Mathias

Johann H. Addicks

12:37 a.m.

...

...
ich habe eben ein wenig mit dem letzten artikeldump von download.wikimedia.org gespielt und angefangen, hyperlinks aus den Artikeln zu extrahieren.

[...]

...
2189 Links nach juris.de 1163 Links nach heise.de 1149 Links nach spiegel.de

Wobei sich imo schon ganz allgemein die Frage stellt, welchen Sinn es in einem Projekt, das sich der Freien und nachhaltigen Verbreitung von Wissen verschrieben hat, Artikel von Anbietern zu verlinken, die ihr "Wissen" in Bezahlarchiven verstecken.

die spiegel-Links werden idR schon von Fleissigen schnell wieder entfernt, bevor SPON die in Bezahl-Links umwandelt. Will sagen: die Links zu SPON sind inzwischen faktisch unerwünscht.

Heise Newsticker-Meldungen habe ich aber noch nicht im Zahlarchiv verschwinden sehen. Was da sonst noch für Links sind: Maile mir eine Liste zu, ich prüfe das gern. Gilt übrigens auch für die SPON-Links.

-jha-

Tim 'avatar' Bartel

7:35 a.m.

Hallo Wikipedianer,

Joerg-Olaf Schaefers schrub:

...

...
1149 Links nach spiegel.de

Wobei sich imo schon ganz allgemein die Frage stellt, welchen Sinn es in einem Projekt, das sich der Freien und nachhaltigen Verbreitung von Wissen verschrieben hat, Artikel von Anbietern zu verlinken, die ihr "Wissen" in Bezahlarchiven verstecken.

Ein Problem duerfte sein, dass es vielen Linksetzern nicht bewusst ist, dass die Spon-Links, die ja zum Zeitpunkt der Linksetzung in der Regel frei zugaenglich sind, nach einiger Zeit 'verschwinden'.

Tschuess, Tim.

Jan

1:11 a.m.

New subject: Benutzerkonten exportieren und importieren

Hallo!

Wie kann ich die Benutzerkonten (Logins) von einer MediaWiki-Installation 1.4.x in eine andere existierende MediaWiki-Installation 1.5.x transferieren?

Grüße, Jan

Thomas R. Koll

9:03 a.m.

New subject: Benutzerkonten exportieren und importieren

Am 09.01.2006 um 01:11 schrieb Jan:

...

Hallo!

Wie kann ich die Benutzerkonten (Logins) von einer MediaWiki- Installation 1.4.x in eine andere existierende MediaWiki- Installation 1.5.x transferieren?

1) Immer neue Mail senden und nicht auf alte Threads antworten, verwirrt die meisten Mail-Clients 2) Ich würde vorschlagen my phpmyadmin einen dump zu erzeugen dabei aber die user_id draußen zu lassen wenn in der neuen db schon user sind. Das ganze dann in der neuen DB wieder importieren. Von Seiten MediaWiki gibt's da gar nichts.

ciao, tom

-- http://www.tomk32.de - just a geek trying to change the world http://de.wikipedia.org/wiki/Benutzer:TomK32 http://verlag.tomk32.de/c/wrdigest

Magnus Manske

10:55 a.m.

New subject: Benutzerkonten exportieren und importieren

Thomas R. Koll wrote:

...

Ich würde vorschlagen my phpmyadmin einen dump zu erzeugen dabei aber die user_id draußen zu lassen wenn in der neuen db schon user sind. Das ganze dann in der neuen DB wieder importieren. Von Seiten

MediaWiki gibt's da gar nichts.

Das gibt Probleme, denn user_token basiert auf der ID. user_id muss also erhalten bleiben, oder user_token muss manuell neu erzeugt werden.

Magnus

Jan

10 Jan 10 Jan

1:19 a.m.

New subject: Benutzerkonten exportieren und importieren

Danke, Markus und Tom.

In der neuen Wiki (1.5) gibt es noch keine Benutzer (außer mich selber und WikiSysOp).

Es wäre halt toll gewesen, wenn es eine Funktion gegeben hätte, mit der man die User von der 1.4 in die neue 1.5 importieren könnte (dann müssten diese sich nicht erneut mit Passwort und Emailadresse registrieren).

Gruß, Jan

Ulrich Fuchs

9 Jan 9 Jan

8:08 a.m.

Am Sonntag, 8. Januar 2006 23:12 schrieb Mathias Schindler:

...

30 Links nach wikiweise.de

Sind das nur Links aus dem Artikelnamensraum oder auch von Diskussionsseiten?

Uli

Mathias Schindler

9:12 a.m.

Ulrich Fuchs wrote:

...

Sind das nur Links aus dem Artikelnamensraum oder auch von Diskussionsseiten?

Alle Links aus 20051211_pages_articles.xml.bz2

Also auch ein "hahaha, 17 Fehler in [http://www.wikiweise.... diesem WW-Artikel]" auf einer Benutzerdiskussionsseite zählt dazu - genauso wie ein Lob oder die neutrale Erwähung.

Mathias

Christian Thiele

10:19 a.m.

Hallo,

Mathias Schindler neubau@presroi.de schrieb am Mon, 09 Jan 2006 09:12:17 +0100:

...

Ulrich Fuchs wrote:

...
Sind das nur Links aus dem Artikelnamensraum oder auch von Diskussionsseiten?

Alle Links aus 20051211_pages_articles.xml.bz2

Also auch ein "hahaha, 17 Fehler in [http://www.wikiweise.... diesem WW-Artikel]" auf einer Benutzerdiskussionsseite zählt dazu - genauso wie ein Lob oder die neutrale Erwähung.

Das ist so nicht richtig ;). Dumps, die auf _articles enden beinhalten nur Artikel und Vorlagen. Und den Wikipedia-Namensraum glaub ich. Auf jeden Fall keine Diskussionsseiten und Benutzerseiten.

MfG Christian Thiele (APPER)