On 2 Mar 2003 at 3:13, GEMMA wrote:
Plik sgl doprowadzi em do postaci, e mam w jednym wierszu jeden artyku . Widz , e s indywidualne cyfry-znaczniki dla artyku u, obrazka, dyskusji etc... Gorzej z sortowaniem bo najsilniejsze narz dzie, jakie posiadam sortuje do 32 kb w linii a niektore artykuly sa dluzsze. Zauwazylem tez, ze w jednym wierszu sa cztery znaczniki - niestety identyczne, w postaci:
','
1.znacznik artykulu 2. tresc 3. komentarze 4. smieci o dacie edycji, edytujacych itp.
no i tu utknalem.
Na poczatku pliku sql jest definicja tabeli, czyli tez formatu danych, w ktorym podane sa wszystkie informacje nt. artykulu. Dane o artykulach sa zapisane w postaci zapytania SQL-owego INSERT... Po slowie kluczowym VALUES jest umieszczona zawartosc rekordow, jeden za drugim z defaultowym separatorem, czyli przecinkiem. Zapytanie INSERT grupuje duzo, ale _nie wszystkie_ rekordy! Caly plik zawiera wiecej takich instrukcji! W rekordzie, wartosci typu varchar, mediumtext, itp. sa otaczane pojedynczymi apostrofami, jesli apostrofy wystepuja w tekscie sa poprzedzone backslashami. Taka wiedza chyba juz powinna wystarczac do rozebrania pliku na czesci.
Kod zrodlowy Wikipedii jest do wgladu pod adresem http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/wikipedia/phpwiki/newcodebase... Na jego podstawie mozesz wydedukowac czego Ci jeszcze potrzeba
Pozdrawiam Youandme