Ja mówię serio, to co obserwuję to już zupełne wariactwo.
Od wczoraj przyrosło nam już ponad 1000 artykułów tym sposobem...
Tym ma się karmić bot w najbliższym czasie:
http://pl.wikipedia.org/wiki/Hrabstwa_w_stanie_Alabama
z tego potem mają być tworzone artykuły o kolejnych hrabstwach w USA, samych takich list ma być 50, bo tyle stanów liczy USA. Razem daje to coś koło 3000 artykułów.
Pojedynczy taki artykuł wygląda tak:
http://pl.wikipedia.org/wiki/Lafayette
To jest disambig tworzony przez bota. Takich disambigów mamy już tysiące. One się doliczają do tych naszych 200 000 + artykułów.
Stwierdzenie WarXa z IRCa:
[01:44] <WarX> disambigi powinny być liczone, ponieważ zawieraja sensowną informację
Tworzenia tych haseł, normalnie nikt nie widzi, bo edycje botów są w ostatnich zmianach standardowo ukryte - a ich włączenie powoduje, że prawie nic oprócz działalności botów się nie widzi, więc każdy prawie to wyłącza. A boty pracują.
Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia?
300 000 artykułów obwieszczamy za 3 miesiące, a może już za miesiąc?
Cytowanie "Tomek "Polimerek" Ganicz" polimerek@gmail.com:
Ja mówię serio, to co obserwuję to już zupełne wariactwo.
Od wczoraj przyrosło nam już ponad 1000 artykułów tym sposobem...
Tym ma się karmić bot w najbliższym czasie:
http://pl.wikipedia.org/wiki/Hrabstwa_w_stanie_Alabama
z tego potem mają być tworzone artykuły o kolejnych hrabstwach w USA, samych takich list ma być 50, bo tyle stanów liczy USA. Razem daje to coś koło 3000 artykułów.
Pojedynczy taki artykuł wygląda tak:
http://pl.wikipedia.org/wiki/Lafayette
To jest disambig tworzony przez bota. Takich disambigów mamy już tysiące. One się doliczają do tych naszych 200 000 + artykułów.
Stwierdzenie WarXa z IRCa:
[01:44] <WarX> disambigi powinny być liczone, ponieważ zawieraja sensowną informację
Tworzenia tych haseł, normalnie nikt nie widzi, bo edycje botów są w ostatnich zmianach standardowo ukryte - a ich włączenie powoduje, że prawie nic oprócz działalności botów się nie widzi, więc każdy prawie to wyłącza. A boty pracują.
Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia?
300 000 artykułów obwieszczamy za 3 miesiące, a może już za miesiąc?
Powinienem napisać, że do maila polimerka wkradło się kilka błędów, niestety w zaistniałej sytuacji muszę napisać prawdę:
Polimerek kłamie w żywe oczy!
Oto fakty: # w ciagu dnia 21.07.2006 powstało 556 artykułów, z czego ludzie napisali 323 artykuły # faktycznie ma powstać 50 list hrabstw w USA (po 1 dla każdego stanu) łącznie hrabstw jest 3216. Każda lista będzie zawierała spis hrabstw wg alfabetu, liczby ludności i powierzchni całkowitej (podane będą:powierzchnia, liczba ludności, pozycja w stanie, w całym kraju, siedziba hrabstwa) oraz mapę stanu z zaznaczonymi hrabstwami (z en.wiki). Pod względem jakości będzie to o niebo lepsze niż na en.wiki, bo tam jest tylko lista alfabetyczna + mapka. # Podany link do Lafayette nie ma nic wspólnego z hrabstwami. Jest to jeden z 6 tysięcy wygenerowanych disambigów hrabst/okręgów/parafii/gmin/miejscowości USA i Portoryko. Disambigi te na pl.wiki są od 18.01.2006 # Tak disambigi doliczają się do tych 200 000, ale niektóre zawierają całkiem ciekawe dane - np. disambig Washington (ujednoznacznienie) zawiera 301 pozycji (to nawet było podane na SG) # Nie ma sensu dyskutować nawet o tym, czy disambigi zawierają sensowną informację, czy nie, bo inaczej nie byłyby tworzone. Można tylko mieć nadzieję, że jaknajszybciej powstaną disambigi nazwisk, ponieważ są one bardzo przydatne. przykładzik: ostatnio potrzebowałem się dowiedzieć jaki stopień wojskowy miał Puławski (nie znałem imienia) wpisałem do wiki-wyszukiwarki i było 5 ekranów z których nic nie wynikało, google powiedział, że to był Kazimierz (którego nota bene na wiki nie było). Na szczęście nie przeszukiwałem tych 5 ekranół wyników. * Artykuły tworzone przez boty są na specjalnej Newpages i nie da się ich ukryć. Po to istnieje flaga bota, aby zwykłe edycje botów nie były widoczne na OZ.
No i na koniec kilka faktów, aby nie było niedomówień:
artykułów o hrabstwach/gminach/bla bla bla w USA jest do wygenerowania 50 tysięcy. Obecnie dochodzę do wniosku, że warte wygenerowania są tylko artykuły o hrabstwach (owe 3216) oraz miastach (25375). Nie będzie to zrobione w najbliższym czasie, ponieważ bardzo powoli idzie mi obróbka danych. Na pewno artykuły o hrabstwach prócz suchych liczb będą zawierały również piramidy wieku dla mieszkańców oraz być może jeszcze jakieś wykresy (zależeć będzie od mojej inwencji i dostępnych technologii). O miastach mogę powiedzieć tylko tyle, że nie powstaną ani w styczniu, ani w lutym.
Na wikipedii na dzień dzisiejszy mamy około 100 000 stubów (na pewno nie więcej)
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie dokładnie to policzyć).
odnośnie dehumanizacji wikipedii przez boty nikt nie bierze pod uwagę, że operator bota też jest człowiekiem, siedzi i opracowuje dane ( zwykle pracuje nad tym więcej niż jedna osoba). Ja sam nad zamianami flag (które można uznać chyba za sukces) spędziłem tydzień prawie bez przerwy.
Nie szukajmy sobie problemów na siłę :)
Pozdrawiam AJF/WarX
ps. ten artykuł, który polimerek zgłosił na SdU służył mi do sprawdzania poprawności danych generowanych przez oprogramowanie
ajf@ich.us.edu.pl napisał(a):
Polimerek kłamie w żywe oczy!
Pomijam całkowicie ten atak personalny i liczę, że zaraz ktoś mnie tu przeprosi. Proszę wskazać, w którym konkretnie miejscu skłamałem "w żywe oczy".
Oto fakty: # w ciagu dnia 21.07.2006 powstało 556 artykułów, z czego ludzie napisali 323 artykuły
Ok - czyli prawda jest taka, że boty generują obecnie na okrągło mniej więcej połowę artykułów, które powstają w Wikipedii. Ale zdaje się, że obecnie znajdują się w fazie częściowego uśpienia i testów.
# Podany link do Lafayette nie ma nic wspólnego z hrabstwami. Jest to jeden z 6 tysięcy wygenerowanych disambigów hrabst/okręgów/parafii/gmin/miejscowości USA i Portoryko. Disambigi te na pl.wiki są od 18.01.2006
Ależ ma - znalazłem go przez proste kliknięcie na listę hrabstw Alabamy, które zgłosiłem do SdU - tam są same czerwone linki + parę niebieskich - wszystkie do tych disambigów, w których prawie wszystkie linki są czerwone. Mamy więc mieć 50 list odsyłających do 3000 disambigów z hakiem, w których - w każdym będzie po kilkadziesiąt czerwonych linków ?
# Tak disambigi doliczają się do tych 200 000, ale niektóre zawierają całkiem ciekawe dane - np. disambig Washington (ujednoznacznienie) zawiera 301 pozycji (to nawet było podane na SG)
Rewelacja - ktoś kto szuka Goerge'a Washingtona i natrafi na tę listę będzie go musiał znaleźć na liście 300 pozycji.
# Nie ma sensu dyskutować nawet o tym, czy disambigi zawierają sensowną informację, czy nie, bo inaczej nie byłyby tworzone.
Jak napiszę hasło [[brbrbrb]] z treścią grgrgrgr - to ponieważ je utworzyłem i ono istnieje, to znaczy że zawiera sensowną treść, bo inaczej bym go nie utworzył. Czy jak dobrze załapałem logikę tego rozumowania? Wg. mnie disambigi z definicji nie zawierają żadnej merytorycznej treści - one odsyłają tylko do innych artykułów. Myślę, że w przypadku tych automatycznych disambigów tworzonych do automatycznych artykułów przydałby się jeszcze jakiś automatyczny czytelnik, którego to automatycznie bardzo zainteresuje. Wydaje mi się, że większość normalnych czytelników to raczej jakoś szczególnie nie zainteresuje jednak, bo to takie trochę monotonne jest...
No i na koniec kilka faktów, aby nie było niedomówień:
artykułów o hrabstwach/gminach/bla bla bla w USA jest do wygenerowania 50 tysięcy. Obecnie dochodzę do wniosku, że warte wygenerowania są tylko artykuły o hrabstwach (owe 3216) oraz miastach (25375). Nie będzie to zrobione w najbliższym czasie, ponieważ bardzo powoli idzie mi obróbka danych. Na pewno artykuły o hrabstwach prócz suchych liczb będą zawierały również piramidy wieku dla mieszkańców oraz być może jeszcze jakieś wykresy (zależeć będzie od mojej inwencji i dostępnych technologii). O miastach mogę powiedzieć tylko tyle, że nie powstaną ani w styczniu, ani w lutym.
A ten disambig? Tam są czerwone linki nawet do jakiejś parafii. Na co to komu, skoro większość tych artykułów ma jednak nie powstać, a szansa, że utworzy je człowiek jest gdzieś w okolicach wartości jak jeden do miliona.
Na wikipedii na dzień dzisiejszy mamy około 100 000 stubów (na pewno nie więcej)
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie dokładnie to policzyć).
Pisał na IRCu, że nie - sam się już w tym pogubił. Pytałem kilkukrotnie różnych osób czy wiedzą ile ich boty generują artykułów. Nigdy nie dostałem konkretnej odpowiedzi, tylko bardzo ogólne i niepewne szacunki. Potrafią podać dokładnie ile artykułów powstało w jakimś obszarze - np. liczba hrabstw w USA - ale jaką to daje sumę ogólną to już nie. Moim słowom można łatwo zaprzeczyć podając takie - dokładne i rzetelne wyliczenie ile i jakich artykułów powstało w tym trybie i w jakim czasie + porównać to z liczbą artykułów utworzonych w tym czasie przez ludzi. To nam da rzetelny obraz tego co się dzieje, bo obecnie mam wrażenie, że sytuacja wymknęła się spod kontroli nawet samym operatorom botów.
odnośnie dehumanizacji wikipedii przez boty nikt nie bierze pod uwagę, że operator bota też jest człowiekiem, siedzi i opracowuje dane ( zwykle pracuje nad tym więcej niż jedna osoba). Ja sam nad zamianami flag (które można uznać chyba za sukces) spędziłem tydzień prawie bez przerwy.
Zmiany artykułów przez boty, które da się zrobić automatycznie to oczywiście jak najbardziej sensowny i użyteczny sposób ich wykorzystania. Nie ma to jednak nic wspólnego z automatycznym tworzeniem stubów, ich list i disambigów do tych stubów.
Nie szukajmy sobie problemów na siłę :)
Jest na to proste lekarstwo. Wyłączyć jak najszybciej tworzenie kolejnych stubów przez boty.
Tomek "Polimerek" Ganicz napisału:
Myślę, że w przypadku tych automatycznych disambigów tworzonych do automatycznych artykułów przydałby się jeszcze jakiś automatyczny czytelnik, którego to automatycznie bardzo zainteresuje. Wydaje mi się, że większość normalnych czytelników to raczej jakoś szczególnie nie zainteresuje jednak, bo to takie trochę monotonne jest...
To, że są monotonne nie znaczy, że nie są to przydatne informacje.
A ten disambig? Tam są czerwone linki nawet do jakiejś parafii. Na co to komu, skoro większość tych artykułów ma jednak nie powstać, a szansa, że utworzy je człowiek jest gdzieś w okolicach wartości jak jeden do miliona.
Parafie to odpowiednik hrabstw w Luizjanie.
On Sat, 28 Jan 2006 11:47:02 +0100, Tomek "Polimerek" Ganicz wrote:
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie dokładnie to policzyć).
Pisał na IRCu, że nie - sam się już w tym pogubił.
...że nie chce mi się liczyć na zawołanie. Ale wszystko zanotowane jest na stronie http://pl.wikipedia.org/wiki/Wikipedysta:Tsca.bot
- czyli ~ 88.500
(z tym, ze w to wliczone są polskie wsie, wrzucania ktorych bot jeszcz nie skończył).
--tsca
- czyli ~ 88.500
(z tym, ze w to wliczone sš polskie wsie, wrzucania ktorych bot jeszcz nie skończył). --tsca
Ale wliczone są też artykuły, które istniały już wcześniej i z którymi dane od bota jedynie zintegrowano.
Tomasz Sienicki napisał(a):
On Sat, 28 Jan 2006 11:47:02 +0100, Tomek "Polimerek" Ganicz wrote:
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie dokładnie to policzyć).
Pisał na IRCu, że nie - sam się już w tym pogubił.
...że nie chce mi się liczyć na zawołanie. Ale wszystko zanotowane jest na stronie http://pl.wikipedia.org/wiki/Wikipedysta:Tsca.bot
- czyli ~ 88.500
(z tym, ze w to wliczone są polskie wsie, wrzucania ktorych bot jeszcz nie skończył).
A bot WarXa i te disambigi "amerykańskie" ? Warto też zwrócić uwagę, że podane dane są z ~ - jaki jest margines błędu w tych obliczeniach ? Czemu tam nie ma dokładnych danych, tylko szacunkowe.
Tomek "Polimerek" Ganicz napisału:
A bot WarXa i te disambigi "amerykańskie" ? Warto też zwrócić uwagę, że podane dane sš z ~ - jaki jest margines błędu w tych obliczeniach ? Czemu tam nie ma dokładnych danych, tylko szacunkowe.
Część z nich została wrzucona do dyskusji artykułów i z nimi zintegrowana, bo były o tej samej miejscowości, a część zostala z tych dyskusji przeniesiona z disambigiem, bo były o czymś innym. Ponadto część została później zintegrowana z istniejącymi już artykułami o miejscowościach, bo np. istniał już art o danej miejscowości pod polską nazwą ale bez redira z nazwy oryginalnej, więc pod oryginalną wrzucił bot. Ciężko więc stwierdzić ile bot utworzył nowych artów, a w ilu te dane zostały jedynie zintegrowane z istniejącymi.
Paweł Dembowski napisał(a):
Tomek "Polimerek" Ganicz napisału:
A bot WarXa i te disambigi "amerykańskie" ? Warto też zwrócić uwagę, że podane dane sš z ~ - jaki jest margines błędu w tych obliczeniach ? Czemu tam nie ma dokładnych danych, tylko szacunkowe.
Część z nich została wrzucona do dyskusji artykułów i z nimi zintegrowana, bo były o tej samej miejscowości, a część zostala z tych dyskusji przeniesiona z disambigiem, bo były o czymś innym. Ponadto część została później zintegrowana z istniejącymi już artykułami o miejscowościach, bo np. istniał już art o danej miejscowości pod polską nazwą ale bez redira z nazwy oryginalnej, więc pod oryginalną wrzucił bot. Ciężko więc stwierdzić ile bot utworzył nowych artów, a w ilu te dane zostały jedynie zintegrowane z istniejącymi.
OK. No to już wiemy, że nie wiemy ile właściwie artykułów stworzyły boty. I prawdopodobnie nigdy się nie dowiemy. Czy to się nie nazywa utrata kontroli?
Dnia Sat, 28 Jan 2006 14:23:51 +0100, Tomek "Polimerek" Ganicz polimerek@gmail.com napisał:
OK. No to już wiemy, że nie wiemy ile właściwie artykułów stworzyły boty. I prawdopodobnie nigdy się nie dowiemy. Czy to się nie nazywa utrata kontroli?
Jak się komuś kiedyś będzie chciało to można sprawdzić. Historia edycji jest. Tylko policzyć trzeba.
On Sat, 28 Jan 2006 14:23:51 +0100, Tomek "Polimerek" Ganicz wrote:
OK. No to już wiemy, że nie wiemy ile właściwie artykułów stworzyły boty. I prawdopodobnie nigdy się nie dowiemy. Czy to się nie nazywa utrata kontroli?
Nie, to sie paranoja nazywa. Tak samo nie wiemy, ile hasel utworzyl dowolny z naprawde aktywnych Wikipedystow - to dokladnie ta sama sytuacja.
Cytowanie "Tomek "Polimerek" Ganicz" polimerek@gmail.com:
OK. No to już wiemy, że nie wiemy ile właściwie artykułów stworzyły boty. I prawdopodobnie nigdy się nie dowiemy. Czy to się nie nazywa utrata kontroli?
A ile ty utworzyłeś artykułów z dokładnością do powiedzmy 5 aby nie przesadzać?
Znasz dokładną liczbę ?
Jak będe siedział pod linem mogę sprawdzić ile powinno było powstać, ale ile zostało zintegrowanych z już istniejącymi artykułami to trudno (i bezcelowo) policzyć, ale na pewno mniej niż 1000.
AJF/WarX
Cytowanie "Tomek "Polimerek" Ganicz" polimerek@gmail.com:
ajf@ich.us.edu.pl napisał(a):
Polimerek kłamie w żywe oczy!
Pomijam całkowicie ten atak personalny i liczę, że zaraz ktoś mnie tu przeprosi. Proszę wskazać, w którym konkretnie miejscu skłamałem "w żywe oczy".
To nie jest atak personalny, tylko stwierdzenie faktu: 1. "Od wczoraj przyrosło nam już ponad 1000 artykułów tym sposobem..." # w ciagu dnia 21.07.2006 powstało 556 artykułów, z czego ludzie napisali 323 artykuły
(tylko z tą datą się machnąłem, bo sprawdzałem 27 stycznia)
2. " z tego potem mają być tworzone artykuły o kolejnych hrabstwach w USA, samych takich list ma być 50, bo tyle stanów liczy USA. Razem daje to coś koło 3000 artykułów. Pojedynczy taki artykuł wygląda tak:
http://pl.wikipedia.org/wiki/Lafayette "
To jest bzdura, ponieważ link do Lafayette jest jednym z błędów, na które poluje. W listach hrabstw nie może być żadnych linków do disambigów, bo operuję na ujednoznacznionych danych (tylko lista siedzib hrabst sprawia pewne problemy, bo jest w niej dużo literówek)
Proszę o ustosunkowanie się do tych dwóch faktów, bo chyba dowdód rozminięcia się z prawdą oczywisty...
Oto fakty: # w ciagu dnia 21.07.2006 powstało 556 artykułów, z czego ludzie napisali
323
artykuły
Ok - czyli prawda jest taka, że boty generują obecnie na okrągło mniej więcej połowę artykułów, które powstają w Wikipedii. Ale zdaje się, że obecnie znajdują się w fazie częściowego uśpienia i testów.
Nie to tsca leci i tylko on. Ja dopiero zbieram dane dla tych 50 list, które są takim złem. Hrabstwa ruszą, jak będą gotowe piramidy wieku i parę innych wykresów.
# Podany link do Lafayette nie ma nic wspólnego z hrabstwami. Jest to jeden
z 6
tysięcy wygenerowanych disambigów hrabst/okręgów/parafii/gmin/miejscowości
USA i
Portoryko. Disambigi te na pl.wiki są od 18.01.2006
Ależ ma - znalazłem go przez proste kliknięcie na listę hrabstw Alabamy, które zgłosiłem do SdU - tam są same czerwone linki + parę niebieskich - wszystkie do tych disambigów, w których prawie wszystkie linki są czerwone. Mamy więc mieć 50 list odsyłających do 3000 disambigów z hakiem, w których - w każdym będzie po kilkadziesiąt czerwonych linków ?
nie, bo: # disambigów jest 6 tysięcy, a nie 3 # linki do disambigów to błąd, nad którym pracuję # niektóre disambigi mają po >100 pozycji - i to już smao w sobie jest ciekawą informacją
# Tak disambigi doliczają się do tych 200 000, ale niektóre zawierają
całkiem
ciekawe dane - np. disambig Washington (ujednoznacznienie) zawiera 301
pozycji
(to nawet było podane na SG)
Rewelacja - ktoś kto szuka Goerge'a Washingtona i natrafi na tę listę będzie go musiał znaleźć na liście 300 pozycji.
# Nie bo go w tym disambigu nie ma, bo nie ujednoznaczniamy nazwisk # dane o wioskach w USA są umieszczane zawsze na końcu disambiga, aby nie śmiecić # to hasło się chyba nazywa Jerzy Waszyngton ....
# Nie ma sensu dyskutować nawet o tym, czy disambigi zawierają sensowną informację, czy nie, bo inaczej nie byłyby tworzone.
Jak napiszę hasło [[brbrbrb]] z treścią grgrgrgr - to ponieważ je utworzyłem i ono istnieje, to znaczy że zawiera sensowną treść, bo inaczej bym go nie utworzył. Czy jak dobrze załapałem logikę tego rozumowania? Wg. mnie disambigi z definicji nie zawierają żadnej merytorycznej treści - one odsyłają tylko do innych artykułów. Myślę, że w przypadku tych automatycznych disambigów tworzonych do automatycznych artykułów przydałby się jeszcze jakiś automatyczny czytelnik, którego to automatycznie bardzo zainteresuje. Wydaje mi się, że większość normalnych czytelników to raczej jakoś szczególnie nie zainteresuje jednak, bo to takie trochę monotonne jest...
Jednym słowym trafiłeś na dziedzinę, której nie lubisz i na siłę musisz ją zgnębić. A powstają np. disambigi do imoin z wykazami sławnych ludzi, którzy mieli to imię :P
No i na koniec kilka faktów, aby nie było niedomówień:
artykułów o hrabstwach/gminach/bla bla bla w USA jest do wygenerowania 50 tysięcy. Obecnie dochodzę do wniosku, że warte wygenerowania są tylko
artykuły
o hrabstwach (owe 3216) oraz miastach (25375). Nie będzie to zrobione w najbliższym czasie, ponieważ bardzo powoli idzie mi obróbka danych. Na
pewno
artykuły o hrabstwach prócz suchych liczb będą zawierały również piramidy
wieku
dla mieszkańców oraz być może jeszcze jakieś wykresy (zależeć będzie od
mojej
inwencji i dostępnych technologii). O miastach mogę powiedzieć tylko tyle,
że
nie powstaną ani w styczniu, ani w lutym.
A ten disambig? Tam są czerwone linki nawet do jakiejś parafii. Na co to komu, skoro większość tych artykułów ma jednak nie powstać, a szansa, że utworzy je człowiek jest gdzieś w okolicach wartości jak jeden do miliona.
Jak Ausir powiedział - Parafia to hrabstwo w Luizjanie, a Okręg na Alasce. Nie - biorąc pod uwagę liczbę sławnych amerykanów (oraz to, że amerykański system edukacyjny nie tłamsi ludzi z prowincji) bardzo dużo tych wiosek ma sławnych mieszkańców.
Na wikipedii na dzień dzisiejszy mamy około 100 000 stubów (na pewno nie
więcej)
tsca.bot nie wygenerował więcej jak 80 000 (na pewno tsca jest w stanie dokładnie to policzyć).
Pisał na IRCu, że nie - sam się już w tym pogubił. Pytałem kilkukrotnie różnych osób czy wiedzą ile ich boty generują artykułów. Nigdy nie dostałem konkretnej odpowiedzi, tylko bardzo ogólne i niepewne szacunki. Potrafią podać dokładnie ile artykułów powstało w jakimś obszarze - np. liczba hrabstw w USA - ale jaką to daje sumę ogólną to już nie. Moim słowom można łatwo zaprzeczyć podając takie - dokładne i rzetelne wyliczenie ile i jakich artykułów powstało w tym trybie i w jakim czasie
- porównać to z liczbą artykułów utworzonych w tym czasie przez ludzi.
To nam da rzetelny obraz tego co się dzieje, bo obecnie mam wrażenie, że sytuacja wymknęła się spod kontroli nawet samym operatorom botów.
Kto jeszcze prócz tsca generuje artykuły ? (no i prócz mnie, ja mogę wszystko na razie policzyć).
Odnośnie liczby artykułów robionych przez ludzi: jakoś w grudniu przestałem codziennie puszczać "codzienne sprawdzanie nowych", do tego momentu oscylowaliśmy wokół 170 artykułów ludzkich na dobę, teraz na pewno przekroczyliśmy 200 (dokładniejsze dane moge podać za kilka dni). Godnym odnotowania jest fakt, że od września do grudnia nastąpił wzrost o zaledwie 30 artykułów na dobę, a teraz w ciągu miesiąca jest to chyba koło 50. W naukach ścisłych to się nazywa koincydencja (ponieważ w czasie wrzesień grudzień nie botowaliśmy artykułów).
odnośnie dehumanizacji wikipedii przez boty nikt nie bierze pod uwagę, że operator bota też jest człowiekiem, siedzi i opracowuje dane ( zwykle
pracuje
nad tym więcej niż jedna osoba). Ja sam nad zamianami flag (które można
uznać
chyba za sukces) spędziłem tydzień prawie bez przerwy.
Zmiany artykułów przez boty, które da się zrobić automatycznie to oczywiście jak najbardziej sensowny i użyteczny sposób ich wykorzystania. Nie ma to jednak nic wspólnego z automatycznym tworzeniem stubów, ich list i disambigów do tych stubów.
Nie szukajmy sobie problemów na siłę :)
Jest na to proste lekarstwo. Wyłączyć jak najszybciej tworzenie kolejnych stubów przez boty.
Wyłączyć jak wyłączyć, może po prostu trzeba zmienić podejście - np. gdy zaczniemy generować artykuły o asteroidach (nie 120k jak mówiłem na IRCu, tylko nazwane asteroidy), to będą to kompletne artykuły.
Pozdrawiam AJF/WarX
ajf@ich.us.edu.pl napisału:
# Nie bo go w tym disambigu nie ma, bo nie ujednoznaczniamy nazwisk # dane o wioskach w USA są umieszczane zawsze na końcu disambiga, aby nie śmiecić # to hasło się chyba nazywa Jerzy Waszyngton .... Pozdrawiam AJF/WarX
Hasło nazywa się George Washington. Od spolszczania nazwisk powoli się u nas odchodzi. I jest w tym disambigu, ale na samej górze, więc nie widzę problemu z szukaniem.
Właściwie to dość skomplikowany temat (czyt.: odwieczna walka pomiędzy ilością a jakością). Sam wolałbym widzieć 500 dobrych, dopracowanych, 'ludzkich' artykułów niż 20 000 robo-stubów, więc dobrze Cię rozumiem Polimerek. Ilość jednak niekoniecznie wpływa deprymująco na jakość.
Kolejne stuby miejscowości Polski nie zmniejszą ilości 'oryginalnych' artykułów. Skoro zaś nie zależy nam na samej _liczbie_ artykułów, nie powinniśmy się tym martwić. Auto-stubowanie specyficznych artykułów, takich jak miejscowości poszczególnych państw, ma z kolei pozytywne strony. Ujednolica pewien zasób wiedzy, który i tak koniec końców trafi do wiki. Przygotowuje pewną platformę podstawowych informacji, która nie tylko jest dość oryginalną bazą informacji, ale jest odskocznią dla dalszego rozwoju (serio, wystarczy spojrzeć na statystyki, które pokazują zwiększoną aktywność jeśli chodzi o lokalną geografię Polski).
Spójrzmy prawdzie w oczy - każdy inaczej może zdefiniować co jest wartościowym artykułem. Jeden zachowa wszystkie (200K artykułów), inny wyrzuci wszystkie stuby, jeszcze inny stwierdzi, że tak naprawdę wartościowe są tylko artykuły na medal, albo nawet nie... Musielibiśmy mieć z 5 różnych rodzajów liczników żeby wszystkich zadowolić. Ale czy faktycznie aż tak zależy nam na samej liczbie artykułów?
Poza tym, autostubowanie wiecznie nie potrwa. IMHO - jeśli każdy pozostanie przy swojej 'działce', także ten etap wikipedii da się bez większych turbulencji przetrwać.
Pz, Winston
From: "Tomek "Polimerek"
Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia? 300 000 artykułów obwieszczamy za 3 miesiące, a może już za miesiąc?
O! "Moja" argumentacja :-))) Przebudźcie się :-)
No więc trzeba spojrzeć prawdzie w oczy. Miasta wsie i przysiólki Polski - OK. Nawet te najmniejsze - bo to polska Wikipedia. Reszta to nieporozumienie. Rozumiem przelecieć się po większych miejscowościach państw sąsiadujących z nami, czy jednostkahh najwyższego rzędu i naprawdę duzych lub w inny sposób znaczących miastach w pozostałych państwach świata. Ale reszta to naprawdę paranoja. od gmin Francji jest francuska Wikipedia, od hrabstw w USA - angielska.
Ja bym nawet zaryzykowł stwierdzenie, że bym pokasował sporo z tej produkcji u-bootów.
Beno/GEMMA
Dnia sobota, 28 stycznia 2006 09:15, Gemma napisał:
Ja bym nawet zaryzykowł stwierdzenie, że bym pokasował sporo z tej produkcji u-bootów.
Stub stworzony przez bota, nie ruszony przez ludzi przez X czasu - do skasowania? Jestem za.
pzdr LukMak
LukMak napisału:
Stub stworzony przez bota, nie ruszony przez ludzi przez X czasu - do skasowania? Jestem za. pzdr LukMak
Zdecydowanie nie. Te stuby zawierają przydatne informacje nawet w obecnej formie. To po prostu stuby, często stuby tworzone ręcznie zawierają jeszcze mniej. Mam wymieniać przykłady? Ale oczywiście na SDU możesz sobie zgłaszać.
LukMak napisału:
Stub stworzony przez bota, nie ruszony przez ludzi przez X czasu - do skasowania? Jestem za. pzdr LukMak
Zdecydowanie nie. Te stuby zawierają przydatne informacje nawet w obecnej formie. To po prostu stuby, często stuby tworzone ręcznie zawierają jeszcze mniej. Mam wymieniać przykłady? Ale oczywiście na SDU możesz sobie zgłaszać.
Jestem za zostawianiem. Te hasła otworzą wygodny układ odniesienia dla twórców dalszychch haseł, np, biograficznych, historycznych, geograficznych i zapewne nie tylko, których dzisiiaj przewidzieć nie możemy. Jeżeli jakaś ważna postać z Francji urodziła się w mało znanej wiosce, to autorowi hasła o niej łatwiej będzie znaleźć ją w wikipedii i dać odpowiedni odnośnik, niż samemu szukać wiadomości - gdzie leży i co o niej jeszcze wiadomo. Zreztą sam kompletny spis takich miejscowości też może nie raz komuś się przydać.
Władysław
LukMak wrote:
Stub stworzony przez bota, nie ruszony przez ludzi przez X czasu - do skasowania? Jestem za.
Miałem już w grudniu napisać hasło "Boris Vian", ale okazało się że inne edycje oraz tzw. 'życie' zabrały mi tak dużo czasu, że sprawa się odsunęła. A tu proszę: 19 stycznia Divino to hasło stworzył(a), i dzięki temu powstał link do "Ville-d'Avray". Link i idąca za nim modyfikacja hasła o miejscowości, nie powstałyby, gdybym ja się dalej lenił, a Divino nie przeszkodziła nieobecność hasła o Vianie.
To co, po jakimś czasie stub miejscowości by wyleciał, dziurawiąc siatkę geografii Francji? Jako kara dla wikipedysty, że nie odstawił randki, dzieci, pracy, szkoły, snu, żeby tylko napisać jakieś hasło o X miesięcy wcześniej? Jeszcze wiele jest postaci francuskich do opisania. Większości z nich przydarzyło się urodzić, a nawet umrzeć, we Francji. Część z tej większości jest na tyle istotna, że wypadałoby o nich wspomnieć w miejscach ich urodzin/śmierci. Itd, itp, wystarczy zdać sobie sprawę, że nie wszyscy są zainteresowani hasłami z dziedziny chemii bądż psychologii -- dla niektórych rozrywką jest dłubanie przy biografiach lub geografii. I dzięki tej rozrywce Wikipedia się rozwija, a dobrze wygenerowane stuby rosną.
Właściwie nie jestem pewien, czy idąc za logiką LukMaka, nie powinno się stworzyć innej reguły: "stub stworzony przez bota, nie ruszony przez ludzi przez X czasu -> wyjmujemy z niego szablon {stub}", bo pewnie więcej nic się o nim w najbliższym czasie nie napisze. A dwulinijkowe hasła w papierowych encyklopediach nie są specjalnie wyróżniane. Po prostu są krótkie, bo tyle tylko da się tam napisać. Stuby francuskie wcale takie krótkie nie są.
Bansp
No więc trzeba spojrzeć prawdzie w oczy. Miasta wsie i przysiólki Polski - OK. Nawet te najmniejsze - bo to polska Wikipedia. Reszta to nieporozumienie. Rozumiem przelecieć się po większych miejscowościach państw sąsiadujących z nami, czy jednostkahh najwyższego rzędu i naprawdę duzych lub w inny sposób znaczących miastach w pozostałych państwach świata. Ale reszta to naprawdę paranoja. od gmin Francji jest francuska Wikipedia, od hrabstw w USA - angielska. Beno/GEMMA
Wikipedie nie są narodowe, ale językowe. Dlaczego niby ktoś, kto nie zna Francuskiego nie może znaleźć w Wikipedii choćby podstawowych informacji o interesującej go miejscowości? Jak dla mnie to, że mamy wszystkie miejscowości Francji, nawet jako stuby, to duży atut.
Witam
2006-01-28 Gemma:
G> ... Ale G> reszta to naprawdę paranoja. od gmin Francji jest francuska Wikipedia, od G> hrabstw w USA - angielska.
Redukując powyższe stwierdzenie do absurdu: Od pisarzy francuskich jest francuska. A Ziemia dla ziemniaków.
Uważam, że artykuły wygenerowane automatycznie na podstawie zbioru danych są wartością samą w sobie (gdzie leży, jak trafić, jak duża) a dodatkowo spełniają role doskonałego "szkieletu" dla ewentualnych wypełniaczy.
From: "Tomek "Polimerek"
Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia? 300 000 artykułów obwieszczamy za 3 miesiące, a może już za
miesiąc?
O! "Moja" argumentacja :-))) Przebudźcie się :-)
No więc trzeba spojrzeć prawdzie w oczy. Miasta wsie i przysiólki
Polski -
OK. Nawet te najmniejsze - bo to polska Wikipedia. Reszta to nieporozumienie. Rozumiem przelecieć się po większych
miejscowościach państw
sąsiadujących z nami, czy jednostkahh najwyższego rzędu i naprawdę
duzych
lub w inny sposób znaczących miastach w pozostałych państwach
świata. Ale
reszta to naprawdę paranoja. od gmin Francji jest francuska
Wikipedia, od
hrabstw w USA - angielska.
Ale przeciez Wikipedia to projekt miedzyjęzykowy - oczywiście zakładam, że hasła z fr wiki, de wiki i en wiki będą tłumaczone. Jak nie jutro, to za 10 lat.
Przykuta
----- Original Message ----- From: "Tomek "Polimerek" Ganicz" To: "Polish Wikipedia mailing list" Sent: Saturday, January 28, 2006 1:52 AM Subject: [Wikipl-l] Pora powstrzymać to szaleństwo z botami generującymi kolejne tysiące artykułów
[TPG] Ja mówię serio, to co obserwuję to już zupełne wariactwo. Od wczoraj przyrosło nam już ponad 1000 artykułów tym sposobem... [ciach] Ktoś się w końcu przebudzi czy zamieniamy nazwę na botopedia? 300 000 artykułów obwieszczamy za 3 miesiące, a może już za miesiąc?