Witam, w dyskusji odnośnie "aktualnego rankingu" pojawiają się, jak zauważyłem, dwa bieguny opinii: jedne optujące za wzrostem ilości artykułów i utrzymywaniem, ewentualnie wzrostem, miejsca w rankingu. Drugie głosy bagatelizują procentowy przyrost arykułów i miejsca w rankingach, stawiając na tzw "jakość" a nie ilość.
Wydaje mi się, że z tych dwu głosów najrozsądniej jest zgodzić się z opcją stawiającą na gwałtowniejszy wzrost ilościowey haseł, które często z początku będą tylko irytującym stubem. Wydaje mi się, że droga szwedzkiej (obecnie w pospolitym ruszeniu realizującej program 200.000 haseł tzw "Projekt 200 000") czy holenderskiej wiki, a obecnie i portugalskiej jest najlepsza.
Ich pomysłem jest stworzenie pewnego koła zamachowego, swoistego perpetuum mobile - działają, jak zauważyłem, wg pewnego uproszczonego rozumowania:
im więcej haseł, tym więcej indeksowanych wyników w google czy ogólnie w sieci, ergo większe prawdopodobieństwo trafienia na hasło wiki, ergo większa ilość nowego narybku,-potencjalnych wikipedystów, ergo większa aktywność na wikipedi, ergo więcej edycji, ergo większy wzrost jakościowy i ilościowy haseł. I w koło Macieju. :)
Być może to rozumowanie jest błędne... ale pamiętam dyskusje sprzed kilku miesięcy na temat stubów, kiedy to była możliwość dokoptowania kilutysięcy biogramów. Gdybyśmy wtedy zaryzykowali moglibyśmy zyskać wielu, wielu nowych wikipedystów którzy w sieci niekoniecznie wklepują hasła: Harry Potter, Michael Jackson czy Kubuś Puchatek.
pozdrawiam Macieias
Chyba wsyzscy się zgadzamy, że jakość haseł jest bardzo ważna. Jednak uważam że głosy takie jak: "to nic, że spadamy w ranklingu - liczy się jakość" to tak naprawde próba usprawiedliwienia małego wzrostu artykułów u nas, bo przecież nie można ślepo zakładać, że jeśli gdzieśtam jest więcej artykułów, to napewno są one gorszej jakości. Poza tym ja wolę jeśli nawet jest hasło jednozdaniowe niż jeśli w ogóle go nie ma. I nie wiązałbym jakości z wielkością, bo to zupełnie co innego. Przykład dużego artykułu, ale nieencyklopedycznego (moim zdaniem): http://pl.wikipedia.org/wiki/CN_Tower . Jak możecie wobec tego oceniać jakość innych wikipedii, jeśli nie znacie tamtego języka? IMO hasło 2-3 zdania ale dobrze napisane jest cenne i porządane. W końcu jeśli ktoś chce wiedzieć np. co to jest anti aliasing, bo spotkał się z takim wyrażeniem np. w opisie gry komputerowej, to nawet takie krótkie hasło mu wystarczy: http://pl.wikipedia.org/wiki/Anti_aliasing .
Podsumowując: 1. Jakość artykułów jest ważna, ale ich wielkość niekoniecznie. 2. Ilość haseł w encyklopeii jest też ważna, jeśli hasła są poprawnie napisane (ale niekoniecznie długie). 3. Prześciganie się w ilości haseł to dobra motywacja do pracy na wikipedii.
On Mon, Jun 06, 2005 at 12:15:46AM +0200, CD wrote:
Tutaj
http://pl.wikipedia.org/wiki/Lista_pisarzy_szwedzkich
sa dane do ponad 300 sensownych stubow. Moze ktos ma automat do robienia takich? Aha, wolalbym, zeby w tych stubach byl jakis taki szablon {{lit-szw-stub}}.
Kto da wiecej?
Pozdrawiam, Alx
On Mon, Jun 06, 2005 at 12:37:48AM +0200, alx@mimuw.edu.pl wrote:
Po raz kolejny przypominam, że mogę puścić bota do stubowania, o ile sposób stubowania będzie zrozumiały dla bota i nie będzie (za dużych) sprzeciwów.
Na przykład ktoś kiedyś obiecał dane geograficzne, ale do dzisiaj ich nie widziałem.
Puścić bota na szwedzkich pisarzach ? Potrzebuję tylko przykładu jak ma taki stub wyglądać i braku ostrego sprzeciwu ?
On Mon, 06 Jun 2005 01:24:31 +0200, Tomasz Wegrzanowski wrote:
Ostry sprzeciw ode mnie; artykuł, który wygląda tak:
----- '''Sigurd Agrell''' ([[1881]]-[[1937]]) - poeta {{szwstub}} [[Kategoria:Szwedzcy pisarze]] -----
...(a więcej z tej listy nie wyciągniesz), to wstyd dla PL-Wiki; te artykuły będą straszyły latami i obniżały opinię o jakości projektu. Poza tym, *te dane już na wiki są* (w formie listy).
--tsca
On Mon, Jun 06, 2005 at 01:28:29AM +0200, Tomasz Sienicki wrote:
Spróbuję cię przekonać. Jeśli mi się nie uda, to oczywiście nie puszczam bota.
Ktoś kiedyś napisze artykuły o wszystkich tych pisarzach. Nie będzie nadmiernym optymizmem ocena, że większość z nich zostanie napisana (przynajmniej kilka zdań każde) w ciągu najbliższych 2 lat. Każdy kto będzie pisał taki artykuł będzie musiał napisać sobie najpierw takiego stuba (niezależnie od tego czy naciśnie zachowaj zaraz potem, czy dopisze coś jeszcze).
Bot więc oszczędzi bardzo wielu osobom jakiejś części pracy. Przejście z takiego substuba do normalnego stuba to często mniej roboty niż ręczne wygenerowanie takiego stuba.
Podział pracy to dobra rzecz - ten sam wikipedysta nie musi zaczynać artykułu, rozbudowywać go, szlifować mu styl, weryfikować źródła, kategoryzować, linkować, interwikować itd. Gdyby tak było (chce się powiedzieć Nupedia) nie zaszlibyśmy tam gdzie zaszliśmy (ech, pamiętam jak mieliśmy niewiele ponad 500 artykułów, mniej niż 1% tego co teraz, a olbrzymia niemiecka miała 1200 ...). Włączenie botów do tej pracy (interwiki robią głównie boty; robią też pewną część kategoryzacji) pozwala innym zająć się bardziej kreatywnymi jej aspektami. Jeśli boty pomogą w substubowaniu, mniejsza ilość ludzkiego wysiłku będzie potrzebna dla tego samego efektu. Nie da się na teraz praktycznie zaimplementować komendy "bocie, napisz mi substuba o X, a ja go uzupełnie" i jedynym technicznie realnym sposobem włączenia botów do pracy jest wykonywanie większej ilości edycji partiami.
Stuby to dobra rzecz. Często wystarczy bardzo podstawowa informacja. Np. jeśli ktoś zobaczy gdzieś "Eva Eriksson", to Google mu znajdą Wikipedię i powiedzą że to urodzona w 1949 malarka, ilustratorka i autorka książek dla dzieci, a nie na przykład Islandzka minister rybołóstwa czy wręcz nowy model telefonu komórkowego Erikssona. Substuby też mają dużo większe szanse szybkiej przemiany w miniartykuły (doświadczenia na angielskiej ze stubami miejstowości zdają się to potwierdzać, większość bardzo szybko uzyskała dużo oryginalnej treści) niż wpisy na listę i są dużo bardziej googlalne.
I na koniec - stubowanie nie będzie obniżało '''jakości''' Wikipedii. Te stuby są jakościowo dobre, zawierają może i mało informacji, ale nie jest to informacja w jakikolwiek sposób wadliwa i mogłaby służyć.
Czujesz się przynajmniej trochę przekonany ;-) ?
Użytkownik Tomasz Wegrzanowski napisał:
Będzie hurraoptymizmem. Zobacz chociażby stuby Mozgulka czy noblistów. Piszmy artykuły. Lepszy jeden artykuł niż 100 stubów. I tak ich nikt nie rozwija (Pojedyncze przykłady, że jest inaczej nie mają znaczenia), a merytorycznej wartości dla nikogo nie mają, gdyż najczęściej zawierają informacje bez trudu dostępne. Tak samo mitem jest, że artykuły powstają wspólnie, że niby każdy dopisze co wie i powstanie arcydzieło. Bzdura. Jest to najgorszy i najmniej wydajny sposób na artykuł. Powstaje albo niespójny językowo, logicznie i stylistyczne potworek, albo ktoś musi włożyć dużo pracy aby doprowadzić takie coś do normalności, a takich zboczeńców jest mało (pojedyncze przykłady j.w.) . Dobre artykuły powstają na bazie wyczerpującego tekstu wprowadzonego przez jednego autora. Są one później cyzelowane, dodawane są jakieś szczegóły. Możliwość napisania czegokolwiek niech będzie wędką dla nowych. Z moich obserwacji wynika, że stub zasadniczo nie zachęca, a zniechęca do rozwijania artykułu. Coś takiego w wikipedystach jest, że bardzo lubią zaczynać i dopisywać w opisie zmian (początek, zacząłem). Zostawmy im tę satysfakcję. To przecież także zabawa. mzopw
Witam
2005-06-06 mzopw:
Spróbuję cię przekonać. Jeśli mi się nie uda, to oczywiście nie puszczam bota.
m> Będzie hurraoptymizmem. Zobacz chociażby stuby Mozgulka czy noblistów. m> Piszmy artykuły. Lepszy jeden artykuł niż 100 stubów...
Niech w _wolnej_encyklopedii_ każdy robi to co mu serce dyktuje. Czyli to czym się chce zajmować.
O ile oczywiście powiększa dostępny zasób informacji.
Uważasz, że trzeba pisać artykuły - świetnie Ktoś chce zamieścić 150 tysięcy polskich miejscowości z nazwą i lokalizacją - świetnie Ktoś inny pisarzy z narodowością i datami - doskonale
On Mon, 6 Jun 2005, mzopw wrote:
Jest to najgorszy i najmniej wydajny sposób na artykuł. Powstaje albo
ehh.... po raz n-ty to przerabiamy... moim zdaniem właśnie kooperacyjne tworzenie artykułów od małych stubów i rozbudowanie ich w kierunku pełnych artykułów to właśnie sedno wikipedii, ale cóż... każdy ma prawo mieć własne zdanie...
Cóż, ja widzę w praktyce na en:, że dużo artykułów utworzonych przez rambota zostało później rozbudowanych (dodana została historia miejscowości itp.), a sekcja o demografii w przypadku dobrze usystematyzowanych danych według mnie jest idealnym zadaniem dla bota.
On Mon, 6 Jun 2005, mzopw wrote:
Jak Ci się znudziło to po co zabierasz głos. Ideologia ideologią a w praktyce widać jak jest.
prawdą jest, że mnie osobiście nurzy ponowne wałkowanie tych samych kwestii... ale jednocześnie nie chciałbym, by wyglądało, że postawa, którą Ty sobą prezentujesz była głoszona jako jedyna słuszna i w związku z tym czuję się zmuszony do zabrania głosu - nawet jeśli ma być to lakoniczne stwierdzenie "a ja mam inną opinię"...
pozdrawiam, blueshade.
Na przykład ktoś kiedyś obiecał dane geograficzne, ale do dzisiaj ich nie widziałem.
Dane geograficzne czy demograficzne (np. z rocznika statystycznego) wedlug mnie bylyby idealne dla takiego bota. Zobaczcie np. na generowane przy pomocy botów artykuły o amerykańskich miejscowościach na en:, zawierające dane demograficzne itp...
Paweł 'Ausir' Dembowski napisał(a):
http://www.stat.gov.pl/bdrweb/mdane.html
Problem w tym, że te dane dotyczą gmin i większych miejscowości. Nie uświadczy się tam mniejszych miasteczek :(
BTW: co wystarczyłoby na stuba o miejscowości? Bo na wiki mamy listę miejscowości z powiatami i województwami, z rocznika można wyciągnąć co najwyżej dane o ilości ludności/powierzchni... Jest tam niestety szereg nieistotnych z punktu widzenia encyklopedii danych (bezrobocie, handel, itp.).
BTW2: Jeśli to kogoś interesuje to mam na dysku w formie plików tekstowych dane z rocznika na temat powierzchni. Można się zamęczyć przy ich ściąganiu z GUS-u ;)
---------------------------------------------------------------------- Znajdz swoja milosc na wiosne... >>> http://link.interia.pl/f187a
Oto przykład takiego automatycznie generowanego artykułu na en: http://en.wikipedia.org/wiki/Springfield%2C_Kentucky
"Paweł 'Ausir' Dembowski" napisał:
Oto przykład takiego automatycznie generowanego artykułu na en: http://en.wikipedia.org/wiki/Springfield%2C_Kentucky
To chyba nie do końca prawda (z tym automatem). Z historii wynika, że artykuł został napisany ręcznie przez użytkownika Ram-Man, mapa dodana przez Seth Ilys. Oni nie wyglądają na boty. Boty tylko kategoryzowały dodawały referencje geograficzne itp.
Daniel;M
Ram-Man używał bota (później pod osobnym loginem RamBot). W ten sposób powstało 30,000 artykułów o amerykańskich miejscowościach. Pierwotna wersja artykułu utworzona przez bota wyglądała tak: http://en.wikipedia.org/w/index.php?title=Springfield%2C_Kentucky&oldid=...
Swoją drogą, to czy uważacie, że byłby sens wrzucić do nas polskie wersje tych 30,000 artykułów RamBota o amerykańskich miastach?
No, może importowanie do nas artykułów o amerykańskich miastach nie jest aż tak dobrym pomysłem (choć ja nei mam nic przeciwko - w końcu są to jednak encyklopedyczne dane, które komuś mogą się kiedyś przydać), to co złego jest w utworzeniu takich artykułów o polskich miejscowościach?
Mnie zresztą mało obchodzą wyścigi między wikipediami, ale po prostu według mnie łatwiej zrobić coś wcześniej automatycznie (gdy jeszcze można, bo nie ma nieencyklopedycznych stubów na ich temat) niż potem dodawać je ręcznie, gdy zautomatyzowane ich dodanie będzie zbyt trudne. Takie automatycznie dodane artykuły to według mnie świetne szablony do dalszej rozbudowy (przynajmniej w przypadku miejscowości, bo jeśli chodzi o biografie to uważam to za zły pomysł).
Dlaczego przeciw? Dla mnie takie wyścigi są śmieszne. Według mnie, jeśli ktoś zna dobrze dany język to uważam że takie stuby o polskich miejscowościach również możnaby dodać automatycznie do wikipedii w innych językach (choćby en: na początek, oprócz pl:).
"Paweł 'Ausir' Dembowski" napisał:
http://en.wikipedia.org/w/index.php?title=Springfield%2C_Kentucky&oldid=...
Nasz substub o miejscowościach na początek mógłby zawierać jedynie dane lokalizacyjne (jak napisałęm poprzednio). Mogłoby powstać ponad 90 tys takich substów.
Dla rankingów przekroczylibyśmy 160-170 tys haseł czyli wylądowalibyśmy na 3 miejscu (po niemieckiej). Tylko czy warto tworzyć takie bardzo bardzo stuby.
DanielM
Cóż, według mnie każda miejscowość powinna i tak ostatecznie znaleźć się w Wikipedii. A takie stuby dadzą przynajmniej dobry szablon dla rozwoju takich artykułów. Chociaż może lepiej zacząć od miejscowości i gmin o których mamy też jakieś dane demograficzne, a których nie ma jeszcze w Wikipedii.
Jak dla mnie za taką automatyzacją przemawia choćby jeden argument - według mnie w encyklopedii powinny znaleźć się wszystkie polskie miejscowości, a wątpię, aby o wielu z nich kiedyś komuś chciało się pisać ręcznie artykuły (choć wiele innych na pewno zostanie później rozbudowanych).
Oczywiście jednak, trochę roboty ręcznej przy takich automatycznych artykułach będzie. Choćby problemy w przypadku konfliktów nazw (np. w przypadku artykułów o tej samej nazwie, ale nie o miejscowościach oraz w przypadku, gdy istnieje już zamiast ujednoznacznienia jeden artykuł o jednej miejscowości o danej nazwie podczas gdy jest ich więcej), a także duplikaty (w przypadku gdyby bot ujednoznaczniał miejscowości w przypadku wielu o takiej samej nazwie jako [[Foo (województwo dolnośląskie)]] i [[Foo (województwo wielkopolskie)]], podczas gdy istniałyby już artykuły [[Foo (powiat wrocławski)]] i [[Foo (powiat poznański)]].
"Paweł 'Ausir' Dembowski" napisał
Wg mnie, jełi już powstawałyby automatyczne artykuły o miejscowościach to w przypadku takich samych nazw ujednoznacznienie powinno odnosić się do powiatu a nie do województwa bowiem bywa, że w tym samym województwie są także miejscowości o tej samej nazwie.
DanielM
A czy jest jakiś przypadek, że w tym samym powiecie, ale w różnych gminach są miejscowości o tej samej nazwie?
"Daniel Miłaczewski" napisał:
tego nie wiem ale postaram się sprawdzić.
Niestety są np. Adamki woj. śląskie, powiat żywiecki, gminy: Czernichów i Jeleśnia. Zatem albo należałoby przyjąć że ujednoznacznienie to gmina albo przygotowując bazę dla bota podać na jakim poziomie powinno byc ujednoznacznienie (powiat lub gmina).
DanielM
Moim zdaniem powinien schodzić do poziomu gminy tylko jeśli w powiecie jest więcej niż jedna taka miejscowość. Swoją drogą to obecnie w Wikipedii z takimi ujednoznacznieniami jest trochę bałagan. Niektóre miejscowości jako ujednoznacznienie mają gminę, inne powiat, inne województwo...
Dnia 2005-06-06 10:13, Daniel Miłaczewski napisał(a):
A czy jest jakiś przypadek, że w tym samym powiecie, ale w różnych gminach są miejscowości o tej samej nazwie?
Niestety są np. Adamki woj. śląskie, powiat żywiecki, gminy: Czernichów i Jeleśnia.
Moim zdaniem ujednoznacznienie powinno być na najwyższym możliwym poziomie, tj.
1. gdy województwa różne: Cisówka (woj. mazowieckie) Cisówka (woj. podlaskie)
2. gdy województwa te same, powiaty różne: Zagórzany (woj. małopolskie, pow. gorlicki) Zagórzany (woj. małopolskie, pow. wielicki)
3. gdy wszystko różne: Adamki (woj. śląskie, gm. Czernichów) Adamki (woj. śląskie, gm. Jeleśnia).
W ten sposób dajemy odbiorcy jak największą szansę na zrozumienie, gdzie jest miejscowość, o której mowa.
Analogicznie można by rozróżniać miejscowości od nie-miejscowości: Kafar (narzędzie) Kafar (woj. łódzkie)
Wikipedysta:Ajank
"Grzegorz "VindicatoR" Pietrzak" napisał:
A gdzie na wiki jest taki wykaz miejscowości?
Dla jakich jednostek te dane posiadasz?
Ja mam wykaz miejscowości w Polsce zawierający ok. 100 tys. pozycji. Oprócz nazwy jest przydział do gminy, powiatu i województwa. Szukam do tego danych na temat liczby ludności i powierzchni. Możne je uzyskać z GUS w postci elektronicznej ale odpłatnie za kilka tys złotych. Mam także wykaz wszytskich gmin i powiatów (łącznie ok. 3000) z przynależnością odpowiednio do powiatu i wojewóztwa z kodami TERYT. Dla gmin i powiatów mam także informacje o liczbie ludności (stałe zameldowanie stan na początek roku, a niebawem na koniec I kwartału),w tym liczbie pełnoletniech, oraz o powierzchni, mogę również przygotować dla każdej gminy i powiatu mapy lokalizacyjne.
Rasaumując na ten moment stub o miejscowości mógłby wyglądać jedynie tak:
Czerniczów - wieś w gminie [[Bolesławiec]] w powiecie [[bolesławiecki (powiat)|bolesławieckim]] w województwie [[dolnośląskie|dolnośląskim]].
Dane powyższe mogły by byc podane tekstem (jak wyżej) lub w postaci tabelki infobox. Podobnie gminy i powiaty (powiaty już chyba w większości są) uzupełnione o liczbę ludności, powierzchnię oraz o dane, które można sciągnąć nieodpłatnie ze stron GUS (o gminach i powiatach).
Można też kupić bazy (poza GUS) zawierające ok 50 tys miejscowości z przydziałem do gmin itd z danymi o liczbie ludności i ewentualnie powierzchni oraz z danymi umożliwiającymi wygenerownie map lokalizacyjnych (koszt ok 6000 zł). Jak widać tekie zakupy są niestety kosztowne.
na pocieszenie za kilka lat ;) ministerstwo infrastruktury i administracji ma ustawowo opublikować wykaz urzędowych nazw wszystkich miescowości w Polsce. Będzie on zatem dostępny bezpłatnie w jakim dzienniku urzędowym ale niestety tylko z danymi lokalizacyjnymi bez informacji statystycznych.
DanielM
On Mon, Jun 06, 2005 at 01:24:31AM +0200, Tomasz Wegrzanowski wrote:
To ja zrobie przyklad lacznie z tym moim szablonem stuba - za kilka dni i jak nie bedzie ostrago sprzeciwu, to poleci.
Pozdrawiam, Alx
| -----Original Message----- | From: ... Tomasz Wegrzanowski | Sent: Monday, June 06, 2005 1:25 AM / | Po raz kolejny przypominam, że mogę puścić bota do stubowania, | o ile sposób stubowania będzie zrozumiały dla bota i nie będzie | (za dużych) sprzeciwów. | | Na przykład ktoś kiedyś obiecał dane geograficzne, ale do | dzisiaj ich nie widziałem.
Taw, zdecydowanie popieram uruchomienie bota dla haseł z pewnym minimum informacji o gminach i miastach. I nie oglądaj się na dość głośne lobby anty-zalążkowo-jakościowe.
Pzdr., Janusz 'Ency' Dorożyński
Dane ma gdzieś DanielM, więc niech po prostu Ci je podeśle... Proponuję na próbę zrobić artykuły na razie jedynie dla *miast*, których jeszcze nie mamy w Wikipedii.
"Paweł 'Ausir' Dembowski" napisał:
Proponuję na próbę zrobić artykuły na razie jedynie dla *miast*, których jeszcze nie mamy w Wikipedii.
Prawie wszystkie miasta mają już swoje artykuły pozostały bez tylko nieliczne (pojedyńcze). Podobnie jest z powiatami. Jedynie większość gmin nie ma jeszcze żadnej wzmianki w osobnym haśle.
DanielM
Właśnie dlatego, że mało jest miast bez artykułów proponuję zacząć od nich. Będą dobrym polem do przetestowania bota.
On Mon, 6 Jun 2005, CD wrote:
krótkie hasło mu wystarczy: http://pl.wikipedia.org/wiki/Anti_aliasing .
akurat baardzo zły przykład... definicja jest po prostu nieprawidłowa...
From: "Przemyslaw 'BlueShade' Idzkiewicz"
krótkie hasło mu wystarczy: http://pl.wikipedia.org/wiki/Anti_aliasing .
akurat baardzo zły przykład... definicja jest po prostu nieprawidłowa...
Raczej mocno niepełna...
Beno/GEMMA
W wiadomości od Gemma było:
krótkie hasło mu wystarczy: http://pl.wikipedia.org/wiki/Anti_aliasing .
Przy okazji: czy po polsku to hasło nie powinno być [[antyaliasing]]? W przetwarzaniu sygnałów w literaturze polskojęzycznej używa się słowa [[aliasing]], nie musimy chyba więc pozostawać przy obcej formie "anti"?
pzdr Łukasz
On Mon, 6 Jun 2005, Gemma wrote:
Tak. Powinno być antyaliasing. Aliasing zresztą też. A to obecne do kasacji, nie na redira.
mimo wszystko bym redirecta zostawił... zbyt dużo jest miejsc, gdzie w polskich tekstach tego typu sformułowania pojawiają się w brzmieniu oryginalnym...
W wiadomości od CD było:
artykułów, to napewno są one gorszej jakości. Poza tym ja wolę jeśli nawet jest hasło jednozdaniowe niż jeśli w ogóle go nie ma. I nie wiązałbym
Może Ty tak. Jednak zauważyłem wśród znajomych ludzi, którzy czegoś szukali na Wikipedii, że takie nic nie warte artykuły raz na zawsze (?) przekreśliły w ich oczach Wikipedię jako źródło wiedzy. Więc co zatem - tworzenie artykułów dla samego ich istnienia, czy dla ludzi?
pzdr Łukasz
Ja akurat jestem przeciwny automatycznemu generowaniu *jednozdaniowych* artykułów, ale artykuły typu http://en.wikipedia.org/wiki/Springfield%2C_Kentucky nie są jednozdaniowe i według mnie są świetnym szablonem do dalszej rozbudowy artykułu - wszelkie informacje, które można wyciągnąć automatycznie z rocznika są podane i autorzy artykułów mogą właśnie zająć się pisaniem o historii miasta itp. - oszczędzając czas, który spędziliby pisząc o rzeczach, o których równie dobrze napisać może bot.
W wiadomości od Paweł 'Ausir' Dembowski było:
To rzeczywiście nie jest zły artykuł, ale podtrzymuję tezę że 99% z tych 90000 pozostanie przez bardzo długi czas na tym samym poziomie który, jak sam przyznajesz, wymagać będzie podniesienia.
Chociaż wolałbym żeby to ludzie a nie boty poprawiły staty pl.wikipedii :) to jednak przekonałeś mnie.
pzdr Łukasz
Lukasz Makowski napisał(a):
Najprawdopodobniej na jakieś najbliższe 50 lat, 90% z tych artykułów pozostanie w stanie zalążkowym. Ktoś się zakłada? Klejny pomysł na automatyczne stuby to wykorzystać bazę danych ACS Registry i przerobić na artykuły informacje o wszystkich 25,788,694 znanych obecnie związków chemicznych :-) Ktoś na to czasem nie wpadł już na Wiki-en ? Co prawda CAS registry jest objęte copyrightem - ale podstawowych danych o związkach chemicznych (wzór sumaryczny, nazwa systematyczna, temperatury przemian fazowych itd) nie da się objąć copyrightem ;-)
Cóż, w przypadku miejscowości większe jest jednak prawdopodobieństwo, że artykuł zostanie poszerzony. A według mnie lepiej, żeby był artykuł w stylu tych rambota niż żaden lub jednolinijkowy stub, których u nas pełno, i to tworzonych ręcznie.
"Paweł 'Ausir' Dembowski" napisał:
Tyle tylko, że dla naszych miejscowości nie mamy takich informacji demograficznych jak w artykułach rambota. Dla powiatów, gmin i miast można z GUS pobrać liczbę ludności z podziałem na płeć oraz dla gmin powierzchnię.
DanielM
A jest gdzieś baza danych współrzędnych geograficznych?
"Paweł 'Ausir' Dembowski" napisał:
A jest gdzieś baza danych współrzędnych geograficznych?
Jest artykuł dla miejscowości na A ([[Skarbnica Wikipedii/Położenie miejscowości]]) ze współrzędnymi z linkiem do http://meta.wikipedia.org/wiki/Maps .
DanielM
Przydałaby się oprócz tego baza danych z numerami kierunkowymi, kodami pocztowymi i tablicami rejestracyjnymi poszczególnych miejscowości...
No i ciekaw jestem czy ktoś z wikipedystów ma może tę pełną, płatną wersję danych demograficznych...
"Paweł 'Ausir' Dembowski" napisał:
No i ciekaw jestem czy ktoś z wikipedystów ma może tę pełną, płatną wersję danych demograficznych...
Jeśli chodzi o liczbę ludności to są dwie szkoły: 1. (GUS) podaje liczbę osób zameldowanych na stałe i tymczasowo 2. (PKW) podaje tylko liczbę osób ze stałym zameldowaniem.
którą wersję przyjmiemy w wikipedii?
DanielM
Paweł 'Ausir' Dembowski napisał(a):
Pisałem już dziś, że współrzędne można raczej bez problemu wyciągnąć z waypointów GPS, rzuciłem dzisiaj na IRCu linka do takiej duuużej przykładowej paczki (źródło nieznane):
http://vindicator.fm.interia.pl/poland-wayponity.zip
---------------------------------------------------------------------- Startuj z INTERIA.PL! >>> http://link.interia.pl/f186c
To może ktoś podejmie się utworzenia przykładowego szablonu dla bota?
Najprawdopodobniej na jakieś najbliższe 50 lat, 90% z tych
artykułów
pozostanie w stanie zalążkowym. Ktoś się zakłada?
Zakładać się nie zakładam, bo sądy na temat przyszłości wysuwam z reguły ostrożnie, ale właśnie dlatego po akcji kategoryzacji należałoby rozpocząć akcję destubizacji artykułów.
Przykuta
Witaj Gemma,
W Twoim liście datowanym 6 czerwca 2005 (19:16:54) można przeczytać:
Miejscowości rozrosną się w artykulach. Ja się zakładam.
Ej - to trochę nie feer. Będziecie osukiwać i dopisywać :D Zresztą też będę. :-)
Beno
Każdy powie 25 milionów - absurd, jednak być może kiedyś, w odległej przyszłości przestanie to być absurdem. Jak na razie na przeszkodzie stoją: ograniczenia techniczne serwerów oraz oprogramowania Wikipedii, które właściwie jest dobre dla encyklopedii <100 000 artykułów. Gdyby oprogramowanie Wiki umożliwiało...: 1. Tworzenie artykułów o tych samych nazwach i rozróżniałoby je ze względu na kategorie 2. W wynikach wyszukiwania był by podział na kategorie (tak jak na Allegro) 3. Wyniki wyszukiwania byłyby posortowane ze względu na popularność hasła (ilość odwiedzin dla hasła).
...to ja bym w ogóle nie widział problemu z dodaniem 35 mln. haseł.
Niestety, nie jest tak i dodawanie tysięcy nowych wsi spowoduje dłuższe listy disambig (jest 15 wsi o nazwie "Cegielnia"!), a to z kolei spowoduje dyskusje nad tym, czy wyróżniać któryś z artykułów jako ten podstawowy, czy nie. A właśnie odnośnie cegielni: http://pl.wikipedia.org/wiki/Cegielnia. jaki jest sens trzymać na na Wikipedii wsię, która nigdy nie miała nawet 1000 mieszkańców?
Moja propozycja taka: ustalić jakąś minimalną liczbę mieszkańców wsi i żeby bot dodawał tylko wsie np. powyżej 3 000 mieszkańców
CD napisał(a):
No tak - ale z CAS Registry i tak nie wygramy. Tam są o każdym związku 3-4 screeny informacji i oni dodają średnio 2000 związków na dobę. Robi to sztab kikudziesięciu ludzi na etatach. No chyba, że kiedyś sam CAS Registry postanowi przejść na technologię Wiki ;-)
jaki jest sens trzymać na na Wikipedii wsię, która nigdy nie miała
nawet
1000 mieszkańców?
Sens jest:
http://pl.wikipedia.org/wiki/Zumpy_(gmina_Boron%C3%B3w)
http://pl.wikipedia.org/wiki/Hucisko_(gmina_Boron%C3%B3w)
Te miejscowości nigdy nie miały 1000 mieszkańców, a jeszcze będę mógł o nich co nieco napisać, jak zbiorę dodatkowe dane.
Tomasz Wegrzanowski napisał:
OK, tylko że en: ma jakby wielokrotnie więcej wikipedystów. Dlatego myślę, żeby podarować sobie wprowadzanie wiosek. Ewentualnie można operację podzielić na dwie fazy: najpierw wprowadzić botem miasta, gminy i powiaty i zobaczyć jak się rozrastają. Później ewentualnie dorzucić wioski - ale tylko jeśli uprzednia akcja rozszerzania miast przebiega sprawnie.
Czy to jest zadowalający kompromis?
OK, tylko że en: ma jakby wielokrotnie więcej wikipedystów.
Wtedy, gdy swoje artykuły generował rambot nie miała chyba więcej niż my teraz.
Dla mnie szybkość rozrastania nie jest taka ważna, liczy się po prostu to, czy o wsiach znajdziemy odpowiednie informacje, bo generacja jednolinijkowych stubów nie ma większego sensu. Ale artykuły typu tych rambota z danymi demograficznymi jak najbardziej, tylko, jak pisał już DanielM, na razie o wioskach takich informacji nie mamy.
Dla mnie szybkość rozrastania nie jest taka ważna, liczy się po
prostu
to, czy o wsiach znajdziemy odpowiednie informacje, bo generacja jednolinijkowych stubów nie ma większego sensu. Ale artykuły typu
tych
rambota z danymi demograficznymi jak najbardziej, tylko, jak pisał
już
DanielM, na razie o wioskach takich informacji nie mamy.
Strony gmin coraz bardziej się rozrastają, ale na początek można by przejrzeć ile tych inforamcji jest. Robiąc powiat lubliniecki spokojnie korzystałem z tego typu stron - poza tym dane mają też strony diecezji
Przykuta
TW> Nie wiem ilu miała Wikipedystów, ale na pewnio miała wówczas *mniej* artykułów TW> niż teraz ma polska.
Ale ilu jest potencjalnych autorów wersji anglojęzycznej (dla których jest to język ojczysty + ci którzy się go uczą), a ilu jest potencjalnych autorów wersji polskiej.
OK, tylko że en: ma jakby wielokrotnie więcej wikipedystów.
Dlatego
myślę, żeby podarować sobie wprowadzanie wiosek. Ewentualnie można operację podzielić na dwie fazy: najpierw wprowadzić botem miasta,
gminy
i powiaty i zobaczyć jak się rozrastają.
To dobry pomysł
Później ewentualnie dorzucić
wioski - ale tylko jeśli uprzednia akcja rozszerzania miast
przebiega
sprawnie.
Hm, wioski czy sołectwa podległe pod gminy - to w końcu podział administracyjny, a choć status powiatów staje się coraz bardziej wątpliwy, to one jednak istnieje.
Twoje twierdzenia są całkowicie sprzeczne z praktyką obserwowaną
na angielskiej
Wikipedii i stubami Rambota, większość których bardzo szybko się
rozrosła.
Przydatny robot nie jest zły, a rozpoczynanie artykułu od wpisywania suchych danych rzeczywiście zniechęca miejscowość xxx siedziba gminy xxx w powiecie xxx (województwo xxx), zamieszkiwana przez xxx mieszkańców. Znaczna część stubów i tego nawet nie ma. (Pomijam już, to, że bot mógłby dodać stuba i kategorie).
Przykuta
Może Ty tak. Jednak zauważyłem wśród znajomych ludzi, którzy czegoś
szukali na
Wikipedii, że takie nic nie warte artykuły raz na zawsze (?) przekreśliły
w
ich oczach Wikipedię jako źródło wiedzy. Więc co zatem - tworzenie
artykułów
dla samego ich istnienia, czy dla ludzi?
Pytanie tylko, czy gdyby ujrzeli napis: "Nie istnieje strona o dokładnie takim artykule", czy to i tak nie spowodawałoby ich zniechęcenia.
Pytanie tylko, czy gdyby ujrzeli napis: "Nie istnieje strona o
dokładnie
takim artykule", czy to i tak nie spowodawałoby ich zniechęcenia.
W takim przypadku nie byłoby odpowiedzi - ta strona to badziew. Ale wydaje mi się, ze to tyczy stron wymagających dopracowania, a nie dobrze zrobionych stubów.
Przykuta
Conr.PL
---------------------------------------------------------------------- Startuj z INTERIA.PL! >>> http://link.interia.pl/f186c
macieias napisał(a):
Oczywiście, że błędne. Nie jest bowiem poparte żadnym dowodem, jest zwykłym eksperymentem myślowym mającym u swego założenia przekonanie, że ludzie funkcjonują jak algorytmy i wystarczy np. im zwiększyć taktowanie zegara, to skutek jest przewidywalny.
Na poparcie tezy odmiennej, że to nie góglowane trafienia w wikipedię są jakimśtam "kołem zamachowym" na pozyskanie wikipedystów (pomijam twórców z gatunku "elo ziomale", a także "Kaśka Nowak, najlepsza matematyczka ziemi kłodzkiej", którzy właśnie tą drogą być może się pojawiają) podam przykład własny: od paru lat napotykam na hasła z wikipedii i jakoś nigdy mnie nie skusiło zaproszenie "i ty możesz dodawać i modyfikować artykuły" ani apel "Pomóż nam dalej rozwijać encyklopedię!". Podziałało natomiast coś odwrotnego: oglądałem w telewizji program o pożarze na stacji King Cross w Londynie, szukałem potem czegoś na temat dziwnego zjawiska zwanego "efektem okopowym". Zazłościło mnie, że nie znalazłem nic po polsku, choć po angielsku "trench effect" znalazłem - i tak powstał mój pierwszy artykuł http://pl.wikipedia.org/wiki/Efekt_okopowy a krótko potem, powstały w wyniku podziału tego pierwszego - kolejny http://pl.wikipedia.org/wiki/Po%C5%BCar_na_stacji_metra_Kings_Cross_w_Londyn...
Od tego czasu (w styczniu br.) mam na koncie ponad 4500 edycji i dwieście tekstów własnych (z czego tylko 1/4 to stuby). Wprawdzie daleko mi do Seleny, która ma edycji 2,5 raza więcej, albo do Radomila - 2 razy i niektórych innych, ale przyznacie chyba sami, że mój przypadek nie pasuje do teorii dodatniego sprzężenia zwrotnego, czy jak kto woli - perpetuum mobile.
Inny przykład, także nie pasujący do tego wyimaginowanego modelu mechanizmu naboru wikipedystów to osoba, która trafiła na Wiki trochę za moją namową i która od pewnego czasu dzieli się swoimi fachowymi opracowaniami ze swojej dziedziny nauki (choć nie tylko), bo ... no właśnie, nie wiem na pewno dlaczego pisze, ale wiem na pewno, że nie dlatego, że trafiła tu przypadkowo z Gógla.
Pozdrawiam Julo
On Mon, Jun 06, 2005 at 09:45:45AM +0200, Juliusz wrote:
Mnie przyciagnela do Wikipedii bardzo podobna rzecz. Ja sie chcialem dowiedziec czegos o literaturze szwedzkiej, a dowiadywanie sie z podrecznika uznalem za nudne i nieskuteczne. Duzo atrakcyjniejsze jest dowiedzenie sie przez napisanie artykulu - dluzej trzeba obcowac z wiedza, pojawiaja sie okazje do ponownego zagladania do artykulu itp. Przy okazji nadarzyla sie tez okazja do czynnego potrenowania jezyka szwedzkiego.
Niestety w ktoryms momencie ktos mi skasowal artykul i od tego czasu poczulem, ze musze sie zainteresowac tez polityka wewnatrz Wikipedii...
Pozdrawiam, Alx
On Mon, Jun 06, 2005 at 11:04:11AM +0200, alx@mimuw.edu.pl wrote:
Ach, zapomnialem podsumowac. Chodzi o to, ze:
Dla czesci ludzi motywacja do pracy w Wikipedii jest samoksztalcenie.
Pozdrawiam, Alx
TNIJ CYTATY!
Beno/GEMMA
----- Original Message ----- From: To: "Polish Wikipedia mailing list" wikipl-l@Wikipedia.org Sent: Monday, June 06, 2005 11:04 AM Subject: Re: [Wikipl-l] Aktualny ranking
http://pl.wikipedia.org/wiki/Po%C5%BCar_na_stacji_metra_Kings_Cross_w_Londyn...
On Mon, Jun 06, 2005 at 05:59:01PM +0200, Gemma wrote:
TNIJ CYTATY!
Jesli to do mnie, to zauwaz, ze ponizszy cytat jest wynikiem przyciecia.
Pozdrawiam, Alx