Jak zapewne wielu z was zauważyło w swoich obserwowanych, tsca.bot utworzył 5000 disambigów dla powtarzających się nazw miejscowości. Wszystkie zostały ujednoznacznione według najwyższej możliwej jednostki podziału terytorialnego - jeśli w danym województwie jest tylko jedna miejscowość o danej nazwie to od województwa, jeśli więcej to od powiatu, jeśli tych jest więcej to od gminy. Jeśli artykuł o danej nazwie już istniał, to lista miejscowości dodana została do jego strony dyskusji, do czasu zintegrowania/przeniesienia itp. Listę takich disambigów w stronach dyskusji znaleźć można tu: http://pl.wikipedia.org/wiki/Wikipedia:WikiProjekt_polskie_miejscowo%C5%9Bci... Mam nadzieję, że wspólnymi siłami to kiedyś skończymy :).
Dzięki jednolitemu systemowi ujednoznacznień unikniemy problemów w rodzaju nowych wikipedystów tworzących artykuł o miejscowości pod daną nazwą, podczas gdy miejscowości o danej nazwie jest kilkadziesiąt. Disambigi zostały wygenerowane z listy 40 000 z ok. 60 000 polskich miejscowości, więc jeśli w którymś z nich brakuje znanej wam miejscowości, dopiszcie ją.
Pozostaje jeszcze jedna kwestia - z posiadanych przez nas danych możemy wygenerować jednozdaniowe stuby o każdej z tych miejscowości, zawierające praktycznie tylko tyle co w tych disambigach. Przykład: http://pl.wikipedia.org/wiki/Biecz_%28wojew%C3%B3dztwo_lubuskie%29 Czy według was jest sens robić coś takiego? Z jednej strony część ludzi uważa, że to za mało jak na stuba, z drugiej zaś strony te artykuły prędzej czy później powstaną, a takie nawet jednozdaniowe stuby będą dobrym szablonem pod rozbudowę - w końcu często autorzy nowych artykułów o wioskach nie wspominają nawet o tym, w jakim województwie, powiecie czy gminie leżą, nie mówiąc już o dodaniu odpowiedniej kategorii. Poza tym zaletą wygenerowania ich byłoby to, że w kategoriach od razu powstałyby prawie kompletne listy miejscowości. No i artykuły o polskich miejscowościach i tak zapewne szybko zostaną rozbudowane. Co o tym myślicie?
Z jednej strony to zawalenie Wiki mikrostubami, z drugiej przydatny szkielet pod rozbudowe.
Poniewaz ograniczenie ilosci stubow wynikalo z checi zachecenia to budowy pelnych hasel, a w tym przypadku wygenerowanie tych zalazkow nikogo zbytnio nie odciagnie, a pomoze opanowac chaos w przyszlosci - osobiscie jestem za.
Pozdrawiam, a.m.
From: "Aegis Maelstrom"
Poniewaz ograniczenie ilosci stubow wynikalo z checi zachecenia to budowy
pelnych hasel,
a w tym przypadku wygenerowanie tych zalazkow nikogo zbytnio nie
odciagnie, a pomoze
opanowac chaos w przyszlosci - osobiscie jestem za.
Ja też za. mam roczniki Poznaj swój kraj a tam pełno onformacji o takich maleństwach
Beno/GEMMA
On Thu, 22 Dec 2005 03:53:17 +0100, Paweł Dembowski wrote:
Pozostaje jeszcze jedna kwestia - z posiadanych przez nas danych możemy wygenerować jednozdaniowe stuby o każdej z tych miejscowości, zawierające praktycznie tylko tyle co w tych disambigach. Przykład: http://pl.wikipedia.org/wiki/Biecz_%28wojew%C3%B3dztwo_lubuskie%29
Cytuję to hasło w całości: "Biecz - wieś w województwie lubuskim, w powiecie żarskim, w gminie Brody. {{stub}}"
Ja jestem przeciw - sub-sub-sub-sub-stuby obniżają poziom Wikipedii, nic nie wnoszą i uczą publikę, że nie warto do Wiki zaglądać. Niektóre Wikipedie słyną z artykułów typu "Gdańsk - miasto w Polsce."; nie chciałbym, by polska Wikipedia do nich dołączyła.
Dobry stub nie jest zły, ale jedno zdanie to za mało.
--tsca
Ja jestem przeciw - sub-sub-sub-sub-stuby obniżajš poziom Wikipedii, nic nie wnoszš i uczš publikę, że nie warto do Wiki zaglšdać. Niektóre Wikipedie słynš z artykułów typu "Gdańsk - miasto w Polsce."; nie chciałbym, by polska Wikipedia do nich dołšczyła. Dobry stub nie jest zły, ale jedno zdanie to za mało. --tsca
Zazwyczaj też jestem przeciw tego typu artykułom - ale w tym wypadku zrobiłbym wyjątek. W nowo tworzonych artykułach o polskich miejscowościach panuje duży chaos i często brak w nich nawet podstawowych informacji. A artykuły te i tak powstaną prędzej czy później.
BTW to dla wsi będących siedzibami gmin mamy też współrzędne geograficzne. Patrz: http://pl.wikipedia.org/wiki/Buczek_%28powiat_%C5%82aski%29 Jak dla mnie przynajmniej te powinniśmy utworzyć.
Gemma napisał(a):
Ale będą motywowały, a ponadto będą wszystkie tak samo zorganizowane. Można najwyżej dodac pola do wypełnienia
Bardzo dobry pomysl, zarowno ten z polami do wypelnienia jak i ten z zaprzegnieciem bota do naszkicowania siatki nazw polskich miejscowosci. To na pewno sie kiedys wypelni -- albo nie nazywamy sie encyklopedia! ;-}
Witam
2005-12-22 Daniel Koć:
DK> Bardzo dobry pomysl, zarowno ten z polami do wypelnienia jak i ten z DK> zaprzegnieciem bota do naszkicowania siatki nazw polskich miejscowosci.
Popieram.
Tasiemcowe listy przeglądać żeby dodać kolejną pozycję - czasu szkoda. Sprawdzić obecność kilku osobiście znanych "zadupi" - ciekawie.
:-)
On Thu, 22 Dec 2005 06:02:59 +0100, Gemma wrote:
Dobry stub nie jest zły, ale jedno zdanie to za mało.
Ale będą motywowały
No ale mówimy o czterdziestu tysiącach jednozdaniowych, całkowicie bezużytecznych dla czytelnika haseł! 40.000 mikrostubów może sobie motywować z całej siły, a i tak wiadomo, że choćby przyszło tysiąc atletów itd... to nie zostaną one rozszerzone. Wrzucenie tego oznaczałoby obniżenie jakości informacji oferowanej przez Wikipedię na masową skalę i na lata.
Zamiast poświęcac energię tej dyskusji poświęćmy ją lepiej zdobyciu lepszych danych źródłowych -- co pozwoli na wygenerowanie PORZĄDNYCH, a nie jednozdaniowych stubów, i to o wszystkich wszystkich 60.000 wioskach, a nie tylko tych 40.000, których nazwy akurat znamy.
Mogłoby się tym zająć Stowarzyszenie WP -- zorientować się, czy można te dane otrzymać odpłatnie od GUSu, czy jako inicjatywa o charakterze edukacyjnym mamy szansę na czyiś sponsoring w ich zdobyciu, w ostateczności czy warto się na to zrzucić, etc.
A na samym końcu: przecież nie jest tak, że boty nie mają co robić i trzeba mikrostuby polskie wrzucać już natychmiast teraz. Do wrzucenia czekają przecież sensownie obszerne dane z Niemiec, USA i Kanady. Zajmijmy się póki co tym, a polskie stuby wrzucimy wtedy, kiedy będziemy mieć dane...
--tsca
A na samym końcu: przecież nie jest tak, że boty nie majš co robić i trzeba mikrostuby polskie wrzucać już natychmiast teraz. Do wrzucenia czekajš przecież sensownie obszerne dane z Niemiec, USA i Kanady. Zajmijmy się póki co tym, a polskie stuby wrzucimy wtedy, kiedy będziemy mieć dane... --tsca
Tylko w przypadku danych polskich, im szybciej to zrobimy tym łatwiej opanujemy bałagan, jaki w tym względzie panuje...
On Thu, 22 Dec 2005 11:54:15 +0100, Paweł Dembowski wrote:
Tylko w przypadku danych polskich, im szybciej to zrobimy tym łatwiej opanujemy bałagan, jaki w tym względzie panuje...
Ale przecież już go opanowaliśmy, tworząc ujednoznacznienia! Teraz jeśli ktoś doda nową wioskę, to albo jest tylko jedna o takiej nazwie, więc niejasności nie ma, albo jest kilka o takiej nazwie, i wtedy istnieje już disambig narzucający nazwę hasła.
--tsca
Ale przecież już go opanowaliśmy, tworzšc ujednoznacznienia! Teraz jeśli ktoś doda nowš wioskę, to albo jest tylko jedna o takiej nazwie, więc niejasności nie ma, albo jest kilka o takiej nazwie, i wtedy istnieje już disambig narzucajšcy nazwę hasła. --tsca
Chodzi też o to, że tak podstawowych informacji jak właśnie gmina, powiat czy województwo autorzy artów o wioskach często nie podają. Poza tym jak już wiemy z IRCa dla jakichś 25 000 artykułów będzie można wygenerować też współrzędne geograficzne i linki do zdjęć satelitarnych i mapek.
[[Wikipedia:Opisy licencji grafiki]] * {{Attribution}} - grafika chroniona prawami autorskimi; jedynym warunkiem wykorzystania pliku jest podanie autorstwa (jeśli to Ty jesteś autorem, wpisz raczej {{cc-by-2.5}}) * {{CopyrightedFreeUseProvidedThat|warunek}} - dozwolony dowolny użytek pod warunkiem (nie może być nadmiernie restrykcyjny)
Czy te nowe licencje są dozwolone na polskiej Wikipedi ??????
Szumyk
[[Wikipedia:Opisy licencji grafiki]]
- {{Attribution}} - grafika chroniona prawami autorskimi; jedynym warunkiem
wykorzystania pliku jest podanie autorstwa (jeśli to Ty jesteś autorem, wpisz raczej {{cc-by-2.5}})
- {{CopyrightedFreeUseProvidedThat|warunek}} - dozwolony dowolny użytek pod
warunkiem (nie może być nadmiernie restrykcyjny) Czy te nowe licencje sš dozwolone na polskiej Wikipedi ?????? Szumyk
Tak. Ale i tak najlepiej wszystko wrzucać po prostu na Commons.
From: "Tomasz Sienicki"
Do wrzucenia czekają przecież sensownie obszerne dane z Niemiec, USA i Kanady. Zajmijmy się póki co tym, a polskie stuby wrzucimy wtedy, kiedy będziemy mieć dane...
Ech Ty internacjonalisto! :-))) Własnie to mnie boli, że wszyscy z takim upodobanem rozpisujemy się tu o zagranicznych postaciach, bitwach, miastach itp. bo najłatwiej o źródła, a nasza polska swojskość leży tu odłogiem, jakbyśmy za karę się tu urodzili.
Czas to podgonić.
Beno
Widzę, że na OZ ażsię roi od przenosin/zakladania diambigów itd :) tak trzymać! ja trochę bawiłam się tymi miejscowościami w październiku - zazwyczaj sprawdzałam położenie w mapa.szukacz.pl - oni maja troche wiecej danych, moze z nimi mozna by sie dogadac? pozdrawiam i biorę sie dalej za disambigi nameless
Widzę, że na OZ ażsię roi od przenosin/zakladania diambigów itd :) tak trzymać! ja trochę bawiłam się tymi miejscowościami w październiku - zazwyczaj sprawdzałam położenie w mapa.szukacz.pl - oni maja troche wiecej danych, moze z nimi mozna by sie dogadac? pozdrawiam i biorę sie dalej za disambigi nameless
Uważajcie na linkujące !!! Szczególnie przed ekowaniem
Beno/GEMMA
"Tomasz Sienicki":
Ja jestem przeciw - sub-sub-sub-sub-stuby obniżają poziom Wikipedii, nic nie wnoszą i uczą publikę, że nie warto do Wiki zaglądać. Niektóre Wikipedie słyną z artykułów typu "Gdańsk - miasto w Polsce."; nie chciałbym, by polska Wikipedia do nich dołączyła.
Dobry stub nie jest zły, ale jedno zdanie to za mało.
To w jakim celu Twój bot dodał prawie puste strony o okręgach wyborczych w Polsce. ;)
DanielM
.
On Thu, 22 Dec 2005 08:38:28 +0100, Daniel Miłaczewski wrote:
To w jakim celu Twój bot dodał prawie puste strony o okręgach wyborczych w Polsce. ;)
Na prośbę osób, które się tym zajmują i chciały mieć szkielety do wypełniania jeszcze przed wyborami. Poza tym, nie puste, a z częściowymi danymi z poprzednich wyborów...
--tsca
Od: "Tomasz Sienicki":
Na prośbę osób, które się tym zajmują i chciały mieć szkielety do wypełniania jeszcze przed wyborami. Poza tym, nie puste, a z częściowymi danymi z poprzednich wyborów...
Owszem dane z poprzednich wyborów są ale na końcu strony. Po otwarciu widać tylko szkielet beż żadnych danych, który informacyjnie wygląda dużo gorzej niz proponowane stuby o miejscowościach. W takiej postaci znajdują się od końca września. Przykład jednego z okręgów: http://pl.wikipedia.org/wiki/Okr%C4%99g_wyborczy_Legnica. Zatem nie ma co się burzyć o stuby dla miejscowości bo "przygadywał kocioł garnkowi"
DanielM
.
On Thu, 22 Dec 2005 12:58:05 +0100, Daniel Miłaczewski wrote:
Przykład jednego z okręgów: http://pl.wikipedia.org/wiki/Okr%C4%99g_wyborczy_Legnica. Zatem nie ma co się burzyć o stuby dla miejscowości bo "przygadywał kocioł garnkowi"
Jest roznica miedzy 40.000 hasel, ktorych nikt nie ruszy, a 40 haslami, z ktorych polowa jest juz opracowana, a druga polowe ktos ma przyjamnej w planach (a nawet te 20 nieopracowanych hasel i tak ma duzo uzytecznych informacji). Nie wiem wiec, jaki widzisz tu zwiazek.
--tsca
A konkretnie to zgłoś się do Wikipedystów Fjl i Cubus1984, którzy to zamówili w trybie ekspresowym ("w najgorszym wypadku zrobimy recznie. Sprawa jest o tyle pilna, ze chcemy zrobic wybory z 2001 jescze przed wyborami aktualnymi." - zob. archiwum mojej dyskusji.)
Jeśli porzucili swój projekt, to pokasuj te strony.
--tsca
"Tomasz Sienicki":>
A konkretnie to zgłoś się do Wikipedystów Fjl i Cubus1984, którzy to zamówili w trybie ekspresowym ("w najgorszym wypadku zrobimy recznie. Sprawa jest o tyle pilna, ze chcemy zrobic wybory z 2001 jescze przed wyborami aktualnymi." - zob. archiwum mojej dyskusji.)
Jeśli porzucili swój projekt, to pokasuj te strony.
To termin juz chyba nie jest aktualny bo dawno po wyborach. Proponowałen na priva odpowiednie przygotowanie danych wyborczych dla bota w celu autoamtycznego uzupełnienia danych ale nie doczekałem się odpowiedzi.
DanielM
.
Od: "Tomasz Sienicki":
Jest roznica miedzy 40.000 hasel, ktorych nikt nie ruszy, a 40 haslami, z ktorych polowa jest juz opracowana, a druga polowe ktos ma przyjamnej w planach (a nawet te 20 nieopracowanych hasel i tak ma duzo uzytecznych informacji). Nie wiem wiec, jaki widzisz tu zwiazek.
Tekst o jednym z okręgów (z bota) Okręg wyborczy Legnica składa się z powiatów ... W wyborach do Sejmu nosi numer 1, a w wyborach do Senatu numer 1. Wybiera się w nim ? posłów (do 2005 10) i ? senatorów.
Tekst o miejscowości (z bota) Biecz - wieś w województwie lubuskim, w powiecie żarskim, w gminie Brody.
Widać róznicę i to chyba na korzyśc tego drugiego. A nie jest istotna ilośc tych stubów ale ich zawartość. Jeśli mogą zatem istnieć takie o okręgach to tym bardziej o miejscowościach.
DanielM
.
pan.2005.12.22.03.16.12.473899@tesa.corp 003001c606b5$153ffc80$0c00000a@lan In-reply-to: 95081065.20051222035317@lexx.eu.org pan.2005.12.22.03.16.12.473899@tesa.corp 003001c606b5$153ffc80$0c00000a@lan MIME-Version: 1.0 Content-Type: text/plain; charset=iso-8859-2 Content-Transfer-Encoding: 8bit Content-Disposition: inline X-Mailer: Interfejs WWW poczty Wirtualnej Polski Organization: Poczta Wirtualnej Polski S.A. http://www.wp.pl/ X-User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; PL; rv:1.7.2) Gecko/20040803 X-IP: 213.134.152.222 X-WP-AV: skaner antywirusowy poczty Wirtualnej Polski S. A. X-WP-SPAM: NO AS1=NO AS2=NO(0.499938) AS3=NO AS4=NO
Dnia 22-12-2005 o godz. 6:02 Gemma napisa³(a):
From: "Tomasz Sienicki"
Dobry stub nie jest zly, ale jedno zdanie to za malo.
Ale beda motywowaly, a ponadto beda wszystkie tak samo
zorganizowane. Mozna
najwyÅŒej dodac pola do wypelnienia
funkcje losuj strone mozna wywalic. w tej chwili jest juz frustracja ludzi którzy chca znalezc jakis ciekawy artykul
zero
From: "zero"
funkcje losuj strone mozna wywalic. w tej chwili jest juz frustracja ludzi którzy chca znalezc jakis ciekawy artykul
Doprawdy? To Ty traktujesz encyklopedię jak książkę? To raczej nietypowe. Natomiast jeśli chodzi o rzeczywistą uzytecznośc Wikipedii, to jest ona duża, bo te hasła, których się szuka najczęściej, są już bardzo obszerne.
Chyba nie powiesz, że tak samo często ludzie zagladaja do artykułów o gminach Francji, jak do tych rzeczywiście często poszukiwanych.
Beno/GEMMA
Dnia 22-12-2005 o godz. 8:45 Gemma napisał(a):
From: "zero"
funkcje losuj strone mozna wywalic. w tej chwili jest juz frustracja ludzi którzy chca znalezc jakis ciekawy artykul
Doprawdy? To Ty traktujesz encyklopedię jak książkę? To raczej
nietypowe.
Natomiast jeśli chodzi o rzeczywistą uzytecznośc Wikipedii, to
jest ona
duża, bo te hasła, których się szuka najczęściej, są już bardzo
obszerne.
moze nietypowe, ale jedni zagladaja do encyklopedii jak spotkaja sie z terminem ktorego nie znaja, inni chca poznac ten termin zanim sie z nim spotkaja ale wracajac do twojego rozumowania, jezeli jest to nietypowe to po co funkcja losuj strone? albo usunac, a jezeli musi zostac to niech sie nazywa losuj gmine Francji albo miejscowosc w Polsce (padaly glosy ze losowanie jest w tej chwili losowaniem w gminach Francji)
Chyba nie powiesz, że tak samo często ludzie zagladaja do
artykułów o
gminach Francji, jak do tych rzeczywiście często poszukiwanych.
na pewno nie powiem, tyle ze dzialania bota marginalizuja ilosciowo artykuly "rzeczywiscie czesto poszukiwane"
zero
na pewno nie powiem, tyle ze dzialania bota marginalizuja ilosciowo artykuly "rzeczywiscie czesto poszukiwane" zero
Nie panikujmy, to samo myślano w angielskiej Wikipedii, gdy generowane przez boty artykuły wyniosły połowę haseł. Obecnie jest to tam niewielki procent artykułów - z czasem wszystko się wyrówna.
From: "Paweł Dembowski" Subject: [Wikipl-l] Ujednoznacznienia polskich miejscowości
http://pl.wikipedia.org/wiki/Wikipedia:WikiProjekt_polskie_miejscowo%C5%9Bci... Mam nadzieję, że wspólnymi siłami to kiedyś skończymy :).
Świetne na zadanie WikiRPG !!
Szumyk