Opracowuje baze prawie 40.000 miejscowosci i mam pytanie. Czy mozna zrobic tak, aby artykul wikipediowy byl podzielony na 2 czesci, z ktorych gorna byla zablokowana przed edycja (ew. dostepna edycja tylko dla adminow? Nie chce, aby edytowalne dla wszystkich byly takie rzeczy jak przynaleznosc do wojewodztwa powiatu i gminy, kod pocztowy, nr kierunkowy, czy ilosc ludzi (i jescze kilka innych podstawowych informacji). Edytwalne bylyby zabytki, atrakcje turystyczne, historia itd. No i czas pomyslec nad kolejnym botem :-))).
Beno/GEMMA
O, a ja mam bazę w której są powiaty w Polsce (do każdego zawarte w nim gminy i województwo w którym się zawiera). Chciałem to połączyć z danymi z [[Miejscowosci w Polsce na literę...]] i wprowadzić to botem. Ewentualnie można by dołączyć dane Państwowej Komisji Wyborczej na temat wyników kilku ostatnich wyborów i referendów (pod działem polityka; te dane są jawne). No, ale bazy 40000 miejscowości to faktycznie nie przebiję.
Mogę też spróbować pomóc poprzez napisanie kolejnego bota, tylko niech najpierw ten ruszy...
Olaf
----- Original Message ----- From: "Gemma" studio@gemma.edu.pl To: wikipl-l@wikipedia.org Sent: Wednesday, December 17, 2003 10:43 AM Subject: [Wikipl-l] miejscowosci
Opracowuje baze prawie 40.000 miejscowosci i mam pytanie. Czy mozna zrobic tak, aby artykul wikipediowy byl podzielony na 2 czesci, z ktorych gorna byla zablokowana przed edycja (ew. dostepna edycja tylko dla adminow? Nie chce, aby edytowalne dla wszystkich byly takie rzeczy jak przynaleznosc do wojewodztwa powiatu i gminy, kod pocztowy, nr kierunkowy, czy ilosc ludzi (i jescze kilka innych podstawowych informacji). Edytwalne bylyby zabytki, atrakcje turystyczne, historia itd. No i czas pomyslec nad kolejnym botem :-))).
Beno/GEMMA
_______________________________________________ WikiPL-l mailing list WikiPL-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikipl-l
From: "Olaf Matyja" olaf@ipipan.waw.pl
O, a ja mam bazę w której są powiaty w Polsce (do każdego zawarte w nim gminy i województwo w którym się zawiera). Chciałem to połączyć z danymi z [[Miejscowosci w Polsce na literę...]] i wprowadzić to botem. Ewentualnie można by dołączyć dane Państwowej Komisji Wyborczej na temat wyników kilku ostatnich wyborów i referendów (pod działem polityka; te
dane
są jawne). No, ale bazy 40000 miejscowości to faktycznie nie przebiję.
Zacząłem zbierać dane z WIEM, raporty Komsji Wyb. i inne listingi z Sieci + wkład własny (mam parę pomysłów, np. położenie na drogach publicznych). W końcu kupiłem bazę Hogi za wlasne pieniadze i w tym dłubię (dzieki temu nie musze sie dorzucac do naszej domeny :-)) ). Jest już kilka wniosków:
1. miejscowość to także dzielnica miasta (która np. była kiedyś oddzielnym miastem, np. Ursus, lub jest znaczącą odmnienną częścią, np. Darłówek jako dzielnica Darłowa. 2. miejscowość i gmina to nie to samo. 3. powiaty mają różne dziwne nazwy np. nie ma zakopiańskiego tylko tatrzański 4. straszny burdel panuje w statusach, np. miasto o statusie gminy na prawach powiatu (chore) 5. ulga dla mnie, że zlikwidowali te dziwne gminy bedace tylko w Warszawie
wnioski wazne:
1. podstawa wikipedii bedzie "miejscowosc" jako byt geograficzny 2. gminy beda oddzielnymi artykulami opisujacymi tylko "gminnosc" gminy a charakter miejscowosci bedacej siedziba gminy bedzie w artykule "miejscowosc" 3. podobnie miasta na prawach powiatu
wniosek ogolny: Jesli tylko Polak cos moze spiepszyc to zrobi to. Chaos mamy w podziale administracyjnym naszego kraju straszny, a nikt w strukturach wladzy nie ma spisu calosci inwentarza. Porozbijane jest to na sluzby i podzielone pomiedzy szczeble. Spis miejscowosci w Polsce dopiero jest tworzony!
Beno
On 17-12-2003, Gemma wrote thusly :
Opracowuje baze prawie 40.000 miejscowosci i mam pytanie. Czy mozna zrobic tak, aby artykul wikipediowy byl podzielony na 2 czesci, z ktorych gorna byla zablokowana przed edycja (ew. dostepna edycja tylko dla adminow? Nie chce, aby edytowalne dla wszystkich byly takie rzeczy jak przynaleznosc do wojewodztwa powiatu i gminy, kod pocztowy, nr kierunkowy, czy ilosc ludzi (i jescze kilka innych podstawowych informacji). Edytwalne bylyby zabytki, atrakcje turystyczne, historia itd. No i czas pomyslec nad kolejnym botem :-))).
Wg mnie to wspaniale, że będzie można dodać więcej polskich miejscowości. Ale doświadczenia Ram-bota z WP-En wymagają przemyślenia.
Mimo że Ram-bot zrobił gigantyczną robotę to odczucia z efektów jego działalności mają już mieszany odbiór.
Najważniejsze zastrzeżenia: * odbieranie ludzkiej twarzy Wikipedii - teraz każdy art. jest robiony ludzkimi rękami, wiem że to pisał Beno, to Jonasz a to Topory. Później duża część art. to będą dane, dokładne suche dane z którymi w zdecydowanej części trudno coś zrobić, jak tylko przyjąć do wiadomości istnienie. Lepsza ludzka treść nawet z nieprawidłowościami i literówkami niż dane wyplute przez robota. * zaśmiecanie recentchanges - z tym można sobie poradzić * liczba robotowych art. będzie większa niż ludzkich - nie będzie można z czystym sercem powiedzieć "to my stworzyliśmy polską Wikipedię" tylko co najwyżej "pomagaliśmy robotowi * dominacja danymi statystycznymi, ktoś kto się zainteresuje głębiej Wikipedią i będzie chciał się dowiedzieć co ona sobą reprezentuje stwierdzi że głównie to zbiór danych statystycznych
Wnioski jakie WP-En wyciągnęła z Ram-bota to: że dane te powinny być w jakiś sposób dostępne w momencie kiedy ktoś (człowiek) zaczyna edytować art. o danej miejscowości. Takim zamysłem była Skarbnica Wikipedii z miejscowościami. Żeby nie szukać w jakim województwie i powiecie jest dana miejscowość można z tamąd wyciąć i wkleić do pisanego art.
Sądzę że bot ale uruchamiany z ręki dla wybranych miejscowości w Polsce powiedzmy powyżej 15 tys. mieszkańców jest rozsądny.
Nie sądzę żeby zablokowanie części art. przed edycją było możliwe.
Pozdrowienia, Kpjas.
Wg mnie to wspaniale, że będzie można dodać więcej polskich miejscowości. Ale doświadczenia Ram-bota z WP-En wymagają przemyślenia.
Mimo że Ram-bot zrobił gigantyczną robotę to odczucia z efektów jego działalności mają już mieszany odbiór.
A co on robił ?
Najważniejsze zastrzeżenia:
- odbieranie ludzkiej twarzy Wikipedii - teraz każdy art. jest robiony
ludzkimi rękami, wiem że to pisał Beno, to Jonasz a to Topory. Później duża część art. to będą dane, dokładne suche dane z którymi w zdecydowanej części trudno coś zrobić, jak tylko przyjąć do wiadomości istnienie.
Dlaczego, zawsze można dopisać o swoim mieście coś bardziej ludzkiego. Chyba znowu dochodzimy do podobnej różnicy zdań, co w przypadku kalendarza.
Lepsza ludzka treść nawet z nieprawidłowościami i literówkami niż dane wyplute przez robota.
A tu się nie zgadzam. Lepsze poprawne dane niż niepoprawne, ale ludzkie. Rzecz gustu.
- zaśmiecanie recentchanges - z tym można sobie poradzić
Dokładnie - można sobie poradzić.
- liczba robotowych art. będzie większa niż ludzkich - nie będzie można z
czystym sercem powiedzieć "to my stworzyliśmy polską Wikipedię" tylko co najwyżej "pomagaliśmy robotowi
Ale robota ktoś napisał, i napracował się też przygotowując dla niego dane. Nic się nie robi samo. Tak czy siak, za tym stoją ludzie.
- dominacja danymi statystycznymi, ktoś kto się zainteresuje głębiej
Wikipedią i będzie chciał się dowiedzieć co ona sobą reprezentuje stwierdzi że głównie to zbiór danych statystycznych
Z tym zarzutem się zgadzam.
Nie sądzę żeby zablokowanie części art. przed edycją było możliwe.
Poza tym wszelkie dane prędzej czy później się zdezaktualizują, więc lepiej, żeby istniała możliwość edycji.
Olaf
On 17-12-2003, Olaf Matyja wrote thusly :
Wg mnie to wspaniale, że będzie można dodać więcej polskich miejscowości. Ale doświadczenia Ram-bota z WP-En wymagają przemyślenia.
Mimo że Ram-bot zrobił gigantyczną robotę to odczucia z efektów jego działalności mają już mieszany odbiór.
A co on robił ?
Wstawił kiladziesiąt tysięcy miejscowości w USA nawet te co mają 2 dusze. Suche ohydne dane, ktorych nie da się poprawić za 100 lat w naszym wypadku 200.
Najważniejsze zastrzeżenia:
- odbieranie ludzkiej twarzy Wikipedii - teraz każdy art. jest robiony
ludzkimi rękami, wiem że to pisał Beno, to Jonasz a to Topory. Później duża część art. to będą dane, dokładne suche dane z którymi w zdecydowanej części trudno coś zrobić, jak tylko przyjąć do wiadomości istnienie.
Dlaczego, zawsze można dopisać o swoim mieście coś bardziej ludzkiego. Chyba znowu dochodzimy do podobnej różnicy zdań, co w przypadku kalendarza.
Bądźmy realistami teraz brakuje nam rąk do pracy, jest nas garstka a nawet na WP-En takie potworki zalegają bez jednej edycji już z rok.
Lepsza ludzka treść nawet z nieprawidłowościami i literówkami niż dane wyplute przez robota.
A tu się nie zgadzam. Lepsze poprawne dane niż niepoprawne, ale ludzkie. Rzecz gustu.
Rzecz zasad Wikipedii. Niech się ogół wypowie.
- zaśmiecanie recentchanges - z tym można sobie poradzić
Dokładnie - można sobie poradzić.
- liczba robotowych art. będzie większa niż ludzkich - nie będzie można z
czystym sercem powiedzieć "to my stworzyliśmy polską Wikipedię" tylko co najwyżej "pomagaliśmy robotowi
Ale robota ktoś napisał, i napracował się też przygotowując dla niego dane. Nic się nie robi samo. Tak czy siak, za tym stoją ludzie.
Liczy się efekt. Albo coś czytam z przyjemnością albo mnie odrzuca. Może mam skrzywienie. Ciekawe jaki byłby odbiór osoby nie-Wikipedysty.
- dominacja danymi statystycznymi, ktoś kto się zainteresuje głębiej
Wikipedią i będzie chciał się dowiedzieć co ona sobą reprezentuje stwierdzi że głównie to zbiór danych statystycznych
Z tym zarzutem się zgadzam.
Nie sądzę żeby zablokowanie części art. przed edycją było możliwe.
Poza tym wszelkie dane prędzej czy później się zdezaktualizują, więc lepiej, żeby istniała możliwość edycji.
Pozdrowienia, Kpjas.
Bądźmy realistami teraz brakuje nam rąk do pracy, jest nas garstka a nawet na WP-En takie potworki zalegają bez jednej edycji już z rok.
Od razu uprzedzam, że miejscowości to mój duży projekt i stąd rzadko jestem teraz na wiki, bo tworzę coś, co z założenia nie będzie stubem, tylko czymś więcej. A że będzie maksymalnie jednorodne to inna sprawa, ale to akurat powinno być naszym celem. Przecież mamy i zalecamy różne szablony.
Beno/GEMMA
On Wed, Dec 17, 2003 at 10:43:11AM +0100, Gemma wrote:
Opracowuje baze prawie 40.000 miejscowosci i mam pytanie. Czy mozna zrobic tak, aby artykul wikipediowy byl podzielony na 2 czesci, z ktorych gorna byla zablokowana przed edycja (ew. dostepna edycja tylko dla adminow? Nie chce, aby edytowalne dla wszystkich byly takie rzeczy jak przynaleznosc do wojewodztwa powiatu i gminy, kod pocztowy, nr kierunkowy, czy ilosc ludzi (i jescze kilka innych podstawowych informacji). Edytwalne bylyby zabytki, atrakcje turystyczne, historia itd. No i czas pomyslec nad kolejnym botem :-))).
Nie da sie. Nie widze tez sensu robienia takich rzeczy. A wizja 40 tysiecy zablokowanych artykulow jest po prostu przerazajaca.
From: "Tomasz Wegrzanowski" taw@users.sf.net
Nie da sie. Nie widze tez sensu robienia takich rzeczy. A wizja 40 tysiecy zablokowanych artykulow jest po prostu przerazajaca.
Wizja dotyczyla blokowania pewnych, ze sie tak wyraze "rekordów" czyli kawalka pliku. Zeby nie kusilo eksperymentatorów podmienianie np. cyfry w numerze kierunkowym, kilometrazy, czy wspólrzednych geogr.
Przeciez nie raz sami sie zastanawialismy, czy poprawka daty w jakims artykule, zrobiona prez bezimiennego IP jest z sensem, czy próba edycji. To tak dla przykladu.
Beno/GEMMA
Wizja dotyczyla blokowania pewnych, ze sie tak
wyraze "rekordów" czyli
kawalka pliku. Zeby nie kusilo eksperymentatorów podmienianie
np. cyfry w
numerze kierunkowym, kilometrazy, czy wspólrzednych geogr.
Przeciez nie raz sami sie zastanawialismy, czy poprawka daty w
jakims
artykule, zrobiona prez bezimiennego IP jest z sensem, czy
próba edycji. To
tak dla przykladu.
W ten sposób, po pewnym czasie, zablokujemy wszystkie dane i nie trzeba będzie niczego sprawdzać ;-) A artykuły będą pisać wyłącznie adminowie i boty. Myślę, że to sprzeczne z ideą projektu.
Kuba_G
--------------------------------------------------------------------- Czasem szczęście może dać utrata pamięci. "Człowiek bez przeszłości" już na DVD i wideo. Doskonały prezent pod choinkę. < http://film.wp.pl/p/film.html?id=2201 >