Cytowanie "Tomek \"Polimerek\" Ganicz" <polimerek(a)gmail.com>om>:
Ja mówię serio, to co obserwuję to już zupełne
wariactwo.
Od wczoraj przyrosło nam już ponad 1000 artykułów tym sposobem...
Tym ma się karmić bot w najbliższym czasie:
http://pl.wikipedia.org/wiki/Hrabstwa_w_stanie_Alabama
z tego potem mają być tworzone artykuły o kolejnych hrabstwach w USA,
samych takich list ma być 50, bo tyle stanów liczy USA. Razem daje to
coś koło 3000 artykułów.
Pojedynczy taki artykuł wygląda tak:
http://pl.wikipedia.org/wiki/Lafayette
To jest disambig tworzony przez bota. Takich disambigów mamy już
tysiące. One się doliczają do tych naszych 200 000 + artykułów.
Stwierdzenie WarXa z IRCa:
[01:44] <WarX> disambigi powinny być liczone, ponieważ zawieraja
sensowną informację
Tworzenia tych haseł, normalnie nikt nie widzi, bo edycje botów są w
ostatnich zmianach standardowo ukryte - a ich włączenie powoduje, że
prawie nic oprócz działalności botów się nie widzi, więc każdy prawie to
wyłącza. A boty pracują.
Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia?
300 000 artykułów obwieszczamy za 3 miesiące, a może już za miesiąc?
Powinienem napisać, że do maila polimerka wkradło się kilka błędów, niestety w
zaistniałej sytuacji muszę napisać prawdę:
Polimerek kłamie w żywe oczy!
Oto fakty:
# w ciagu dnia 21.07.2006 powstało 556 artykułów, z czego ludzie napisali 323
artykuły
# faktycznie ma powstać 50 list hrabstw w USA (po 1 dla każdego stanu) łącznie
hrabstw jest 3216. Każda lista będzie zawierała spis hrabstw wg alfabetu,
liczby ludności i powierzchni całkowitej (podane będą:powierzchnia, liczba
ludności, pozycja w stanie, w całym kraju, siedziba hrabstwa) oraz mapę stanu z
zaznaczonymi hrabstwami (z en.wiki). Pod względem jakości będzie to o niebo
lepsze niż na en.wiki, bo tam jest tylko lista alfabetyczna + mapka.
# Podany link do Lafayette nie ma nic wspólnego z hrabstwami. Jest to jeden z 6
tysięcy wygenerowanych disambigów hrabst/okręgów/parafii/gmin/miejscowości USA i
Portoryko. Disambigi te na pl.wiki są od 18.01.2006
# Tak disambigi doliczają się do tych 200 000, ale niektóre zawierają całkiem
ciekawe dane - np. disambig Washington (ujednoznacznienie) zawiera 301 pozycji
(to nawet było podane na SG)
# Nie ma sensu dyskutować nawet o tym, czy disambigi zawierają sensowną
informację, czy nie, bo inaczej nie byłyby tworzone. Można tylko mieć nadzieję,
że jaknajszybciej powstaną disambigi nazwisk, ponieważ są one bardzo przydatne.
przykładzik: ostatnio potrzebowałem się dowiedzieć jaki stopień wojskowy miał
Puławski (nie znałem imienia) wpisałem do wiki-wyszukiwarki i było 5 ekranów z
których nic nie wynikało, google powiedział, że to był Kazimierz (którego nota
bene na wiki nie było). Na szczęście nie przeszukiwałem tych 5 ekranół wyników.
* Artykuły tworzone przez boty są na specjalnej Newpages i nie da się ich ukryć.
Po to istnieje flaga bota, aby zwykłe edycje botów nie były widoczne na OZ.
No i na koniec kilka faktów, aby nie było niedomówień:
artykułów o hrabstwach/gminach/bla bla bla w USA jest do wygenerowania 50
tysięcy. Obecnie dochodzę do wniosku, że warte wygenerowania są tylko artykuły
o hrabstwach (owe 3216) oraz miastach (25375). Nie będzie to zrobione w
najbliższym czasie, ponieważ bardzo powoli idzie mi obróbka danych. Na pewno
artykuły o hrabstwach prócz suchych liczb będą zawierały również piramidy wieku
dla mieszkańców oraz być może jeszcze jakieś wykresy (zależeć będzie od mojej
inwencji i dostępnych technologii). O miastach mogę powiedzieć tylko tyle, że
nie powstaną ani w styczniu, ani w lutym.
Na wikipedii na dzień dzisiejszy mamy około 100 000 stubów (na pewno nie więcej)
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie
dokładnie to policzyć).
odnośnie dehumanizacji wikipedii przez boty nikt nie bierze pod uwagę, że
operator bota też jest człowiekiem, siedzi i opracowuje dane ( zwykle pracuje
nad tym więcej niż jedna osoba). Ja sam nad zamianami flag (które można uznać
chyba za sukces) spędziłem tydzień prawie bez przerwy.
Nie szukajmy sobie problemów na siłę :)
Pozdrawiam
AJF/WarX
ps. ten artykuł, który polimerek zgłosił na SdU służył mi do sprawdzania
poprawności danych generowanych przez oprogramowanie