To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł
ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są
"wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np.
XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś
podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach,
coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem).
Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję
gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykuta <przykuta(a)o2.pl> napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła
14 000 małych stubów
bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco
ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&ol…
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&ol…
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&ol…
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę
edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać
jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl
wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi
wersjami językowymi.
Przykuta
_______________________________________________
Lista dyskusyjna WikiPL-l
WikiPL-l(a)lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikipl-l
--
-- Matma Rex