On 2 Mar 2003 at 3:13, GEMMA wrote:
Plik sgl doprowadzi em do postaci, e mam w jednym
wierszu jeden
artyku . Widz , e s indywidualne cyfry-znaczniki dla artyku u,
obrazka, dyskusji etc... Gorzej z sortowaniem bo najsilniejsze narz
dzie, jakie posiadam sortuje do 32 kb w linii a niektore artykuly sa
dluzsze. Zauwazylem tez, ze w jednym wierszu sa cztery znaczniki -
niestety identyczne, w postaci:
','
1.znacznik artykulu 2. tresc 3. komentarze 4. smieci o dacie edycji,
edytujacych itp.
no i tu utknalem.
Na poczatku pliku sql jest definicja tabeli, czyli tez formatu danych,
w ktorym podane sa wszystkie informacje nt. artykulu.
Dane o artykulach sa zapisane w postaci zapytania SQL-owego
INSERT... Po slowie kluczowym VALUES jest umieszczona zawartosc rekordow,
jeden za drugim z defaultowym separatorem, czyli przecinkiem.
Zapytanie INSERT grupuje duzo, ale _nie wszystkie_ rekordy!
Caly plik zawiera wiecej takich instrukcji!
W rekordzie, wartosci typu varchar, mediumtext, itp. sa otaczane pojedynczymi
apostrofami, jesli apostrofy wystepuja w tekscie sa poprzedzone backslashami.
Taka wiedza chyba juz powinna wystarczac do rozebrania pliku na czesci.
Kod zrodlowy Wikipedii jest do wgladu pod adresem
http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/wikipedia/phpwiki/newcodebas…
Na jego podstawie mozesz wydedukowac czego Ci jeszcze potrzeba
Pozdrawiam
Youandme