Trochę głupio po dniu dobrej wiadomości o tym pisać, ale może nikogo to nie obejdzie. Nie są już dostępne na http://download.wikimedia.org pełne zrzuty bazy wikipedii w formacie .sql, dostępne są pliki .xml, ale nie oferują pełnej zawartości baz. Ponadto import tych plików też nie jest możliwy w pełni.
Pzdr., Janusz 'Ency' Dorożyński
On Fri, Sep 09, 2005 at 10:26:57AM +0200, Dorożyński Janusz wrote:
Trochę głupio po dniu dobrej wiadomości o tym pisać, ale może nikogo to nie obejdzie. Nie są już dostępne na http://download.wikimedia.org pełne zrzuty bazy wikipedii w formacie .sql, dostępne są pliki .xml, ale nie oferują pełnej zawartości baz. Ponadto import tych plików też nie jest możliwy w pełni.
Coś słyszałem o zmianie formatu dumpów. Pewnie to jakieś przygotowania.
Wanted
On Fri, Sep 09, 2005 at 10:26:57AM +0200, Dorożyński Janusz wrote:
Trochę głupio po dniu dobrej wiadomości o tym pisać, ale może nikogo to nie obejdzie. Nie są już dostępne na http://download.wikimedia.org pełne zrzuty bazy wikipedii w formacie .sql, dostępne są pliki .xml, ale nie oferują pełnej zawartości baz. Ponadto import tych plików też nie jest możliwy w pełni.
W jakim sensie nie oferują pełnej zawartości i nie jest możliwy w pełni ich import ?
| -----Original Message----- | From: .. Tomasz Wegrzanowski | Sent: Friday, September 09, 2005 4:33 PM / | W jakim sensie nie oferują pełnej zawartości i
| -----Original Message----- | From: wikitech-l-bounces@wikimedia.org ... Brion Vibber | Sent: Wednesday, September 07, 2005 9:26 PM / | * The page database now includes deleted page text, which can't be | publically redistributed.
W takim jak powyżej. Jedyną dla mnie, a jestem pewien że również dla wszystkich, zrozumiałą i akceptowaną rzeczą w dotychczasowych eksportach rzeczą był brak tabeli users z kontami i hasłami. Teraz mamy coś co nie będzie ujawniane. Może to nikomu nie będzie potrzebne, ale ja wolę mieć możliwość aby samemu to stwierdzić, a nie być prowadzonym za rączkę przez fundamentalistycznych wyznawców religii xml.
| nie jest możliwy w pełni ich import ?
importDump.php z pages_current.xml.gz (dla PlWIki z końca lipca) wywala się po 15 tysiącach, choć z komunikatem o błędzie, zamiennik Kate importDump.phps - po około 140 tysiącach, i tu już bez jakiegokolwiek komunikatu. Dla mnie oznacza to, że nie jest możliwy w pełni import. Może jest to myślenie wąskie i ortodoksyjne, ale tak już mam. Dla mnie takie dumpy są całkowicie bezużyteczne, a ich publikowanie marnowaniem przestrzeni dyskowej i być może zbieranych ostatnio 200 tysięcy zielonych na eksperymenty komputerowych eugeniuszy nieliczących się z nikim. Pzdr., Janusz 'Ency' Dorożyński
PS. Tekstu Briona nie przetłumaczyłem ze zrozumiałych dla częsci bywalców tej listy powodów :-)) . E.
On Fri, Sep 16, 2005 at 02:10:31PM +0200, Dorożyński Janusz wrote:
W jakim sensie nie oferują pełnej zawartości i
| * The page database now includes deleted page text, which can't be | publically redistributed.
W takim jak powyżej. Jedyną dla mnie, a jestem pewien że również dla wszystkich, zrozumiałą i akceptowaną rzeczą w dotychczasowych eksportach rzeczą był brak tabeli users z kontami i hasłami. Teraz mamy coś co nie będzie ujawniane. Może to nikomu nie będzie potrzebne, ale ja wolę mieć możliwość aby samemu to stwierdzić, a nie być prowadzonym za rączkę przez fundamentalistycznych wyznawców religii xml.
Chodzi o to, że skasowane strony i skasowane rewizje, które są dostępne do wglądu jedynie dla administratorów, nie są w dumpie.
Nigdy nie były w żadnych dumpach.
Kiedyś były w bazie w osobnej tablicy, która zwyczajnie nie była włączana w dumpy. Teraz są w tej samej tablicy co inne strony, tylko oznaczone odpowiednią flagą.
Ta treść nie była, nie jest i nie będzie nigdy w żadnych dumpach, i nie ma to nic wspólnego z xmlem.
| -----Original Message----- | From: ... Tomasz Wegrzanowski | Sent: Saturday, September 17, 2005 1:14 PM / | Chodzi o to, że skasowane strony i skasowane rewizje, które są | dostępne do wglądu jedynie dla administratorów, nie są w dumpie. | | Nigdy nie były w żadnych dumpach. | | Kiedyś były w bazie w osobnej tablicy, która zwyczajnie | nie była włączana w dumpy. Teraz są w tej samej tablicy | co inne strony, tylko oznaczone odpowiednią flagą.
Ok., rozumiem. Dzięki za wyjaśnienie. Pzdr., Janusz 'Ency' Dorożyński
Trochę głupio po dniu dobrej wiadomości o tym pisać, ale może nikogo to nie obejdzie. Nie są już dostępne na http://download.wikimedia.org pełne zrzuty bazy wikipedii w formacie .sql, dostępne są pliki .xml, ale nie oferują pełnej zawartości baz. Ponadto import tych plików też nie jest możliwy w pełni.
Pzdr., Janusz 'Ency' Dorożyński
Dla mnie obecny format jest lepszy a w dodatku łatwiej zasaać wszystko.
Szkoda tylko że http://download.wikimedia.org/wikipedia/pl/ ma wciąż dane z lipca, bo ja z tych zrzutów korzystam intensywnie od paru lat zresztą
Beno/GEMMA
On Fri, Sep 09, 2005 at 05:09:52PM +0200, Gemma wrote:
Trochę głupio po dniu dobrej wiadomości o tym pisać, ale może nikogo to nie obejdzie. Nie są już dostępne na http://download.wikimedia.org pełne zrzuty bazy wikipedii w formacie .sql, dostępne są pliki .xml, ale nie oferują pełnej zawartości baz. Ponadto import tych plików też nie jest możliwy w pełni.
Pzdr., Janusz 'Ency' Dorożyński
Dla mnie obecny format jest lepszy a w dodatku łatwiej zasaać wszystko.
Szkoda tylko że http://download.wikimedia.org/wikipedia/pl/ ma wciąż dane z lipca, bo ja z tych zrzutów korzystam intensywnie od paru lat zresztą
No dumpy są teraz robione, tylko że idą alfabetycznie (de, en, fr itd. są wcześniej)