[Wikipl-l] wiki do pobrania
GEMMA
studio w gemma.edu.pl
Nie, 2 Mar 2003, 02:13:23 UTC
> Opcja 2: sam zmajstrowujesz sobie jakies skrypty
> w perlu, pythonie albo w innym ulubionym jezyku
> i ekstrachujesz artykuly.
> Tego chyba tez nie bedzie chcialo Ci sie robic.
Jestem fanem dosa. Intensywnie korzystam z batchy. Mam takiego progsa -
gsar.exe - general search and replace utlility.
Plik sgl doprowadziłem do postaci, że mam w jednym wierszu jeden artykuł.
Widzę, że są indywidualne cyfry-znaczniki dla artykułu, obrazka, dyskusji
etc... Gorzej z sortowaniem bo najsilniejsze narzędzie, jakie posiadam
sortuje do 32 kb w linii a niektore artykuly sa dluzsze. Zauwazylem tez, ze
w jednym wierszu sa cztery znaczniki - niestety identyczne, w postaci:
','
1.znacznik artykulu 2. tresc 3. komentarze 4. smieci o dacie edycji,
edytujacych itp.
no i tu utknalem. Cel jest nastepujacy: Miec plik ascii tylko z zawartoscia
artykulow. Chce go miec aby zrobic np. statystyke bledow. Na razie znajduje
rozne bledy i niestety wiekszosc z nich jest w innych miejscach niz artykuly
i wale na slepo. Wyszukuje bledy, i co ktorys tylko okazuje sie bledem
wartym poprawy. Pewnie zreszta zauwazyles, ze skacze ostatnio po roznych
haslach - wlasnie tych, w ktorych znalazlem bledy.
Gdybym dysponowal tylko danymi z artykulow moglbym porobic sporo fajnych
rzeczy.
Beno
ps. Uzywam w dosie jeszcze narzedzia rpsort.com - genialne, sortuje z
roznymi opcjami (np. usuwanie duplikatow) a sortowanie pliku 15 MB to jest
kilka sekund - wprost niewiarygodnie szybko.
Więcej informacji o liście dyskusyjnej WikiPL-l