Zapraszam :-)
http://pl.wikipedia.org/wiki/Wikipedysta:Ency/Konferencja_ruwiki_Moskwa_2012
Z uszanowaniem, Janusz "Ency" Dorożyński, członek stowarzyszenia
Na konferencji poproszono mnie o wskazanie skąd w naszych infoboksach haseł o miejscowościach Polski wzięły się liczby o populacji - jeden z rosyjskich wikipedianinów będzie botował nasze miejscowości w ruwiki. Zadałem na szybko pytanie w Kawiarence (choć od sporego czasu jej unikam - korzyść z niej żadna) i efekt mizerny http://pl.wikipedia.org/wiki/Wikipedia:Kawiarenka/Artyku%C5%82y#Dane_o_liczb... dności . Jednak trochę mi nieswojo podać, że nie wiadomo skąd były brane dane. Jakieś wsparcie?
Z uszanowaniem, Janusz "Ency" Dorożyński
W dniu 11 listopada 2012 05:08 użytkownik Dorożyński Janusz (4w) dorozynskij@wampnm.webd.pl napisał:
Na konferencji poproszono mnie o wskazanie skąd w naszych infoboksach haseł o miejscowościach Polski wzięły się liczby o populacji - jeden z rosyjskich wikipedianinów będzie botował nasze miejscowości w ruwiki. Zadałem na szybko pytanie w Kawiarence (choć od sporego czasu jej unikam - korzyść z niej żadna) i efekt mizerny http://pl.wikipedia.org/wiki/Wikipedia:Kawiarenka/Artyku%C5%82y#Dane_o_liczb... dności . Jednak trochę mi nieswojo podać, że nie wiadomo skąd były brane dane. Jakieś wsparcie?
Częsciowo z Terrytu i częściowo z roczników statystycznych GUS. W niektórych miejscowościach są też wykorzystane dane z BIP-ów, lub zwykłych stron internetowych odpowiednich miejscowości, gmin, czy powiatów i czasem się zdarza, że ktoś dodał/zmienił jakieś dane liczbowe i nie został zrewertowany mimo, że nie podał źródła.
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 8:43 AM / | Częsciowo z Terrytu i częściowo z roczników statystycznych GUS.
O liczbie ludności? TERYT tego nie ma (zresztą i nie powinien mieć), GUS w dużym roczniku podaje dane dla miast powyżej 20 tys., do tego w postaci nie nadającej się do przetwarzania wprost (tabele w pdfie).
| W niektórych | miejscowościach są też wykorzystane dane z BIP-ów, lub zwykłych stron | internetowych odpowiednich miejscowości, gmin, czy powiatów i czasem się | zdarza, że ktoś dodał/zmienił jakieś dane liczbowe i nie został zrewertowany | mimo, że nie podał źródła.
Czyli radosna twórczość? W takim przypadku nic dziwnego, że W. jest uważana za niewiarygodną.
Pozdrowienia, Janusz "Ency" Dorożyński
Oczywiście nie wiem, skąd pochodzą dane publikowane w Wikipedii, ale w serwisie WWW GUS publikowane są dane o liczbie ludności każdej gminy z podziałem na obszar miejski i wiejski (oczywiście nie do wszystkich gmin taki podział ma zastosowanie...): http://stat.gov.pl/gus/5840_655_PLK_HTML.htm
W tej chwili tabela ta ma pewne opóźnienie, gdyż opublikowane są dane według stanu z 31 grudnia 2010, wyliczone na podstawie corocznej aktualizacji wyników Narodowego Spisu Powszechnego NSP 2002.
GUS zapowiadał, że do końca października opublikowane zostaną dane według stanu z 31 grudnia 2011 wyliczone na podstawie NSP 2011. Mamy 11 listopada i można się spodziewać, że lada dzień dane te zostaną opublikowane.
Dane wyliczone na podstawie NSP 2011 są już dostępne w Banku Danych Lokalnych, skąd można je pobrać w bardzo wygodnej formie tabeli przystosowanej do przetwarzania w bazach danych lub w tabelach przestawnych: http://www.stat.gov.pl/bdl/app/strona.html?p_name=indeks
Trzeba wybrać dział "Ludność", a następnie "Stan ludności i ruch naturalny" i w kolejnym kroku - w zależności od tego, co nas interesuje "Ludność według grup wieku i płci" lub "Ludność według lokalizacji terytorialnej".
Dane te są już także dostępne w serwisie GUS w nieco bardziej sztywnej formie w bazie Demografia: http://www.stat.gov.pl/gus/5840_13211_PLK_HTML.htm oraz w nieco bogatszym układzie "na zamówienie" http://demografia.stat.gov.pl/bazademografia/Tables.aspx - szczególnie interesujące są tu dane za 2010 rok, gdyż równolegle opublikowano tabele wyliczone poprzednio według NSP 2002 oraz obecnie według NSP 2011 - różnice czasem są bardzo znaczące!
Władek
W dniu 11 listopada 2012 18:42 użytkownik Dorożyński Janusz (4w) < dorozynskij@wampnm.webd.pl> napisał:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 8:43 AM / | Częsciowo z Terrytu i częściowo z roczników statystycznych GUS.
O liczbie ludności? TERYT tego nie ma (zresztą i nie powinien mieć), GUS w dużym roczniku podaje dane dla miast powyżej 20 tys., do tego w postaci nie nadającej się do przetwarzania wprost (tabele w pdfie).
| W niektórych | miejscowościach są też wykorzystane dane z BIP-ów, lub zwykłych stron | internetowych odpowiednich miejscowości, gmin, czy powiatów i czasem się | zdarza, że ktoś dodał/zmienił jakieś dane liczbowe i nie został zrewertowany | mimo, że nie podał źródła.
Czyli radosna twórczość? W takim przypadku nic dziwnego, że W. jest uważana za niewiarygodną.
Pozdrowienia, Janusz "Ency" Dorożyński
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Władysław Majewski | Sent: Sunday, November 11, 2012 7:05 PM / | Oczywiście nie wiem, skąd pochodzą dane publikowane w Wikipedii, ale w | serwisie WWW GUS publikowane są dane o liczbie ludności każdej gminy z | podziałem na obszar miejski i wiejski (oczywiście nie do wszystkich gmin taki | podział ma zastosowanie...):
Dziękuję, to cenna wskazówka, choć zdaje się nie ma tam danych o każdej indywidualnej miejscowości (przez co rozumiem też każdą wioskę).
Pozdrowienia, Janusz "Ency" Dorożyński
W dniu 11 listopada 2012 18:42 użytkownik Dorożyński Janusz (4w) dorozynskij@wampnm.webd.pl napisał:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 8:43 AM / | Częsciowo z Terrytu i częściowo z roczników statystycznych GUS.
O liczbie ludności? TERYT tego nie ma (zresztą i nie powinien mieć), GUS w dużym roczniku podaje dane dla miast powyżej 20 tys., do tego w postaci nie nadającej się do przetwarzania wprost (tabele w pdfie).
| W niektórych | miejscowościach są też wykorzystane dane z BIP-ów, lub zwykłych stron | internetowych odpowiednich miejscowości, gmin, czy powiatów i czasem się | zdarza, że ktoś dodał/zmienił jakieś dane liczbowe i nie został zrewertowany | mimo, że nie podał źródła.
Czyli radosna twórczość? W takim przypadku nic dziwnego, że W. jest uważana za niewiarygodną.
Januszu, nie wiem czemu jesteś taki agresywny i napastliwy - to raczej nie pomaga. Te dane są w GUS, tyle, że porozrzucane po różnych miejscach: np: Ludność gmin masz tutaj:
http://www.stat.gov.pl/gus/5840_13211_PLK_HTML.htm
a poszerzona wersja Teryt zawiera liczbę ludności z rozbiciem na poszczególne miejscowości - stan na koniec 2010.
Na stronie GUS te tabele są generowane dynamicznie, dlatego nie da się podać dokładnego urla do nich.
Patrz np:
http://demografia.stat.gov.pl/bazademografia/Tables.aspx
Tu masz np. dane demograficzne wygenerowane dla miejscowości Bedoń Przykościelny, choć nie wiem czy ci ten link zadziala, bo jest dynamiczny:
http://www.stat.gov.pl/bdl/app/miejsc_w.display?p_id=24075&p_token=0.624...
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 7:09 PM / | Januszu, nie wiem czemu jesteś taki agresywny i napastliwy - to raczej nie | pomaga.
Tomaszu, jeśli tak twierdzisz, to tak jest. Przepraszam. Może pewnym usprawiedliwieniem jest moje drobne zmęczenie - konferencja, słuchanie wystąpień, pisanie relacji na żywo z tłumaczeniem w locie, własne wystąpienie, dyskusje, pytania, prośby, itd.
| Te dane są w GUS, tyle, że porozrzucane po różnych | miejscach:
Do tego dynamicznych. Moim skromnym zdanie (ale może mam za mało umiejętności) nie do użycia przez program. W połączeniu z tym, co pisałeś wcześniej wynika, że dane o populacjach polskich wsi nie zostały wprowadzone z jakiegoś ustandaryzowanego zasobu. Co to oznacza, to już mnie nie dotyczy, zwłaszcza że kolega Rosjanin od bota nie odezwał się. Możemy zapomnieć o sprawie.
Z uszanowaniem, Janusz "Ency" Dorożyński
W dniu 11 listopada 2012 21:36 użytkownik Dorożyński Janusz (4w) dorozynskij@wampnm.webd.pl napisał:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 7:09 PM / | Januszu, nie wiem czemu jesteś taki agresywny i napastliwy - to raczej nie | pomaga.
Tomaszu, jeśli tak twierdzisz, to tak jest. Przepraszam. Może pewnym usprawiedliwieniem jest moje drobne zmęczenie - konferencja, słuchanie wystąpień, pisanie relacji na żywo z tłumaczeniem w locie, własne wystąpienie, dyskusje, pytania, prośby, itd.
| Te dane są w GUS, tyle, że porozrzucane po różnych | miejscach:
Do tego dynamicznych. Moim skromnym zdanie (ale może mam za mało umiejętności) nie do użycia przez program. W połączeniu z tym, co pisałeś wcześniej wynika, że dane o populacjach polskich wsi nie zostały wprowadzone z jakiegoś ustandaryzowanego zasobu. Co to oznacza, to już mnie nie dotyczy, zwłaszcza że kolega Rosjanin od bota nie odezwał się. Możemy zapomnieć o sprawie.
Ależ były. Z tego co wiem bot został nakarmiony danymi z GUS - dokładnie nie wiem w jaki sposób (możliwe, że były pobrane botem na czyjś prywatny dysk, ew. zdaje się, że GUS je sprzedawał w formie płyty DVD), ale nasze dane są zgodne z tym co jest w GUS (stan na koniec 2010), oprócz tych przypadków, gdy ktoś jednostkowo ręcznie je aktualizował. głównie na podstawie bipów odpowiednich jednostek.
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 9:47 PM / | Ależ były. Z tego co wiem bot został nakarmiony danymi z GUS - dokładnie nie | wiem w jaki sposób (możliwe, że były pobrane botem na czyjś prywatny dysk, | ew. zdaje się, że GUS je sprzedawał w formie płyty DVD), ale nasze dane są | zgodne z tym co jest w GUS (stan na koniec 2010), oprócz tych przypadków, gdy | ktoś jednostkowo ręcznie je aktualizował. głównie na podstawie bipów | odpowiednich jednostek.
No to mamy problem. Z weryfikowalnością. To jeden z naszych pięciu filarów, taki jak prawa autorskie.
Z uszanowaniem, Janusz "Ency" Dorożyński
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 9:47 PM / | Ależ były. Z tego co wiem bot został nakarmiony danymi z GUS - dokładnie nie | wiem w jaki sposób (możliwe, że były pobrane botem na czyjś prywatny dysk, | ew. zdaje się, że GUS je sprzedawał w formie płyty DVD), ale nasze dane są | zgodne z tym co jest w GUS (stan na koniec 2010), oprócz tych przypadków, gdy | ktoś jednostkowo ręcznie je aktualizował. głównie na podstawie bipów | odpowiednich jednostek.
No to mamy problem. Z weryfikowalnością. To jeden z naszych pięciu filarów, taki jak prawa autorskie.
Z uszanowaniem, Janusz "Ency" Dorożyński
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Tomasz Ganicz | Sent: Sunday, November 11, 2012 9:47 PM / | Ależ były. Z tego co wiem bot został nakarmiony danymi z GUS - dokładnie nie | wiem w jaki sposób (możliwe, że były pobrane botem na czyjś prywatny dysk, | ew. zdaje się, że GUS je sprzedawał w formie płyty DVD), ale nasze dane są | zgodne z tym co jest w GUS (stan na koniec 2010), oprócz tych przypadków, gdy | ktoś jednostkowo ręcznie je aktualizował. głównie na podstawie bipów | odpowiednich jednostek.
No to mamy problem. Z weryfikowalnością. To jeden z naszych pięciu filarów, taki jak prawa autorskie.
Z uszanowaniem, Janusz "Ency" Dorożyński
W dniu 11 listopada 2012 21:36 użytkownik Dorożyński Janusz (4w) < dorozynskij@wampnm.webd.pl> napisał:
Do tego dynamicznych. Moim skromnym zdanie (ale może mam za mało umiejętności) nie do użycia przez program.
Odpowiedź zależy od definicji :użycia przez program". Jeśli rozumiesz przez to weryfikację lub aktualizację na żywo wykonywaną w dowolnej chwili i na każde życzenie - to jest to technicznie możliwe, ale trudne poza granice praktycznego rozsądku. Jeśli natomiast wystarczy Ci procedura pozwalająca raz na rok wykonać aktualizację z rozsądnym nakładem pracy ręcznej - to nie ma problemu: pięcioma kliknięciami generujesz plik CSV lub XLS, w którym w kolejnych wierszach masz mniej wiecej taki zestaw: teryt miejscowości, jej nazwę, rok którego dotyczą dane, wiek lub grupę wiekową, płeć, liczbę mieszkańców. W system są wbudowane ograniczniki, które limitują długość w ten sposób przygotowanych plików do ok. 5 - 10 tysięcy wierszy (dokładny limit różni się dla różnych tabel). Wygerenerowanie plików zawierających dane o liczbie ludności we wszystkich miejscowościach zajmuje szacunkowo około 2-3 godzin - a taki zestaw plików można już znakomicie przetwarzać.
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Władysław Majewski | Sent: Monday, November 12, 2012 9:42 PM / | Odpowiedź zależy od definicji :użycia przez program". Jeśli rozumiesz przez to | weryfikację lub aktualizację na żywo wykonywaną w dowolnej chwili i na każde | życzenie - to jest to technicznie możliwe, ale trudne poza granice praktycznego | rozsądku. Jeśli natomiast wystarczy Ci procedura pozwalająca raz na rok | wykonać aktualizację z rozsądnym nakładem pracy ręcznej - to nie ma problemu: | pięcioma kliknięciami generujesz plik CSV lub XLS, w którym w kolejnych | wierszach masz mniej wiecej taki zestaw: teryt miejscowości, jej nazwę, rok | którego dotyczą dane, wiek lub grupę wiekową, płeć, liczbę mieszkańców. W | system są wbudowane ograniczniki, które limitują długość w ten sposób | przygotowanych plików do ok. 5 - 10 tysięcy wierszy (dokładny limit różni się dla | różnych tabel). Wygerenerowanie plików zawierających dane o liczbie ludności | we wszystkich miejscowościach zajmuje szacunkowo około 2-3 godzin - a taki | zestaw plików można już znakomicie przetwarzać.
Władysławie, warto by się tym zająć, bo jak widać mamy bardzo poważny problem z weryfikowalnością takich danych w plwiki. A jak nie zająć (ja niestety odpadam, i tak sypiam poniżej normy), to choćby opisać na plwiki.
Z uszanowaniem, Janusz "Ency" Dorożyński
| _______________________________________________ | Lista dyskusyjna WikiPL-l | WikiPL-l@lists.wikimedia.org | https://lists.wikimedia.org/mailman/listinfo/wikipl-l
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Władysław Majewski | Sent: Monday, November 12, 2012 9:42 PM / | Odpowiedź zależy od definicji :użycia przez program". Jeśli rozumiesz przez to | weryfikację lub aktualizację na żywo wykonywaną w dowolnej chwili i na każde | życzenie - to jest to technicznie możliwe, ale trudne poza granice praktycznego | rozsądku. Jeśli natomiast wystarczy Ci procedura pozwalająca raz na rok | wykonać aktualizację z rozsądnym nakładem pracy ręcznej - to nie ma problemu: | pięcioma kliknięciami generujesz plik CSV lub XLS, w którym w kolejnych | wierszach masz mniej wiecej taki zestaw: teryt miejscowości, jej nazwę, rok | którego dotyczą dane, wiek lub grupę wiekową, płeć, liczbę mieszkańców. W | system są wbudowane ograniczniki, które limitują długość w ten sposób | przygotowanych plików do ok. 5 - 10 tysięcy wierszy (dokładny limit różni się dla | różnych tabel). Wygerenerowanie plików zawierających dane o liczbie ludności | we wszystkich miejscowościach zajmuje szacunkowo około 2-3 godzin - a taki | zestaw plików można już znakomicie przetwarzać.
Władysławie, warto by się tym zająć, bo jak widać mamy bardzo poważny problem z weryfikowalnością takich danych w plwiki. A jak nie zająć (ja niestety odpadam, i tak sypiam poniżej normy), to choćby opisać na plwiki.
Z uszanowaniem, Janusz "Ency" Dorożyński
| _______________________________________________ | Lista dyskusyjna WikiPL-l | WikiPL-l@lists.wikimedia.org | https://lists.wikimedia.org/mailman/listinfo/wikipl-l
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Władysław Majewski | Sent: Monday, November 12, 2012 9:42 PM / | Odpowiedź zależy od definicji :użycia przez program". Jeśli rozumiesz przez to | weryfikację lub aktualizację na żywo wykonywaną w dowolnej chwili i na każde | życzenie - to jest to technicznie możliwe, ale trudne poza granice praktycznego | rozsądku. Jeśli natomiast wystarczy Ci procedura pozwalająca raz na rok | wykonać aktualizację z rozsądnym nakładem pracy ręcznej - to nie ma problemu: | pięcioma kliknięciami generujesz plik CSV lub XLS, w którym w kolejnych | wierszach masz mniej wiecej taki zestaw: teryt miejscowości, jej nazwę, rok | którego dotyczą dane, wiek lub grupę wiekową, płeć, liczbę mieszkańców. W | system są wbudowane ograniczniki, które limitują długość w ten sposób | przygotowanych plików do ok. 5 - 10 tysięcy wierszy (dokładny limit różni się dla | różnych tabel). Wygerenerowanie plików zawierających dane o liczbie ludności | we wszystkich miejscowościach zajmuje szacunkowo około 2-3 godzin - a taki | zestaw plików można już znakomicie przetwarzać.
Władysławie, warto by się tym zająć, bo jak widać mamy bardzo poważny problem z weryfikowalnością takich danych w plwiki. A jak nie zająć (ja niestety odpadam, i tak sypiam poniżej normy), to choćby opisać na plwiki.
Z uszanowaniem, Janusz "Ency" Dorożyński
| _______________________________________________ | Lista dyskusyjna WikiPL-l | WikiPL-l@lists.wikimedia.org | https://lists.wikimedia.org/mailman/listinfo/wikipl-l