W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Hello!
Sposób jest na bardzo prosty - musimy szukać baz danych w XLS czy innym podobnym formacie i przekazywać je, wraz z odpowiednim opracowaniem, naszym operatorom botów, żeby też tworzyli hasła. Może warto byłoby stworzyć osobną podstronę w przestrzeni Wikipedia, gdzie operatorzy chętnych botów (bo nie każdy bot umie zrobić coś takiego) przyjmowaliby takie pomysły i gdzie można by nad nimi dyskutować?
Poza tym istotnym problemem jest też umiejętność botów przetwarzania danych z innych źródeł niż XLS (np. z baz złożonych z plików HTML). Ja sam często działam na granicy pracy bota, to znaczy tworzę całe serie bardzo podobnych do siebie haseł, różniących się tylko zmiennymi w poszczególnych rubrykach, korzystając z rozmaitych baz danych (chociażby hasła o biskupach i diecezjach katolickich na podst. catholic-hierarchy.org). Pytanie tylko, czy boty dałyby sobie z tym radę.
Generalnie mam wrażenie (może bardzo subiektywne), że pomysłów trochę jest, ale brakuje nam wikipedystów o wystarczająco wysokim poziomie umiejętności technicznych. A często też np. tacy, za przeproszeniem, humaniści jak ja nie do końca wiedzą i rozumieją, jakie są granice możliwości np. bota czy skryptu.
Pozdrawiam!
Powerek38
W dniu 2011-10-24 14:04, Przykuta pisze:
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Popieram idee botowania nowych haseł. Czasem mam informacje o czymś i gdy brak chociażby stuba to trudno dobrać hasło do którego ta informacja pasuje. Mam nadzieje że znajdą się chętni by utworzyć botem wszystkie hasła które się da. Co z gwiazdami? Marek Mazurkiewicz
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykuta przykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Witam,
Dnia 24 października 2011 Bartosz Dziewoński napisał:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Pozdrawiam, Robert
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
W dniu 24 października 2011 16:27 użytkownik Robert Drózd rdrozd@sgh.waw.pl napisał:
Witam,
Dnia 24 października 2011 Bartosz Dziewoński napisał:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Jako baza danych samo MediaWiki jest w sumie trochę jak wbijanie mikroskopem gwoździ. W ramach Wiki Lubi Zabytki ludzie z Centrum:Polska zrobili taką wyszukiwarkę zabytków:
http://wikilubizabytki.centrumcyfrowe.pl/
ona potrafi np: pokazać wszystkie zabytkowe pałace w miejscowości "X" bez konieczności zabaw w kategoryzowanie...
Bazuje to bezpośrednio na spisach pozyskanych z Narodowego Instytutu Dziedzictwa.
Były próby podlinkowania w tym zasobów z Wikipedii i Commons - ale niestety panuje u nas i w spisach NID straszny bałagan terminologiczny, który uniemożliwia automatyczne zestrojenie jednego z drugim. Szczególnie złym pomysłem było stworzenie w Commons zasady, że jak zabytek ma swoją kategorię, to w opisach zdjęć usuwa się szablon z tymże numerem... W efekcie wiele zdjęć numerów w opisach nie ma...
U nas zbytki bardzo często nazywają się zupełnie inaczej niż w spisach NID, może dałoby się coś wykombinować bazując na samych numerach inwentarzowych - to by wymagało jednak bota, która by utworzył bazę typu: nr inwentarzowy -> nazwa zabytku w spisie NID -> nazwa hasła u nas -> lista zdjęć i/lub kategorii na Commons gdzie występuje numer inwentarzowy i następnie może dałoby się to zintegrować z tą wyszukiwarką z Centrum:Polska, która IMHO ma dużo większy sens niż ręczne tworzenie tabelek w Wikipedii, choć pewnie mając taką bazę dałoby się potem takie tabelki zrobić automatem.
Kolejny krok to by było dodanie do bazy geokoordynatów zabytków i rzucenie listy zabytków jako warstwy na mapy.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Pozdrawiam, Robert
Pomysły były, ale to trzeba obgadać. Dla dużych miast można zrobić listy jako osobne artykuły, bo w hasłach o tych miastach się po prostu nie zmieszczą. Dla małych gmin, można tabelki wrzucić do haseł - bez ich wyodrębniania jako osobnych artykułów:
http://pl.wikipedia.org/wiki/Gmina_Ogrodzieniec#Zabytki
IMO powiaty + miasta na prawach powiatu mogłyby mieć hasła o zabytkach. W przypadku miast, które nie są na prawach powiatu, a mają dużo zabytków - to jest kwestia skali (np. Wałbrzych ma ich bardzo dużo). No, można by zrobić botem rozeznanie :)
http://pl.wikipedia.org/wiki/Dyskusja_Wikiprojektu:Wiki_Lubi_Zabytki#Botowan...
przykuta
Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą odbędzie się już pewnie na Wiki: http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_bote...
Powerek38
W dniu 2011-10-24 16:50, masti pisze:
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
już się tym zająłem. Jak przygotuję botowalną tabelkę to dam znać
masti
On 10/24/2011 05:33 PM, Powerek38 wrote:
Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą odbędzie się już pewnie na Wiki: http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_bote...
Powerek38
W dniu 2011-10-24 16:50, masti pisze:
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Te nl wiki stuby o gatunkach wyglądają przyzwoicie. A u nas wikiprojekt zoologiczny działa całkiem prężnie, choć nie wiem, kto czyta listę. Można by i im podrzucić, w końcu nl wiki nie powinna nas przegonić ;)
Elfhelm
Te nl wiki stuby o gatunkach wyglądają przyzwoicie. A u nas wikiprojekt zoologiczny działa całkiem prężnie, choć nie wiem, kto czyta listę. Można by i im podrzucić, w końcu nl wiki nie powinna nas przegonić ;)
Elfhelm
No, można by się miedzy wersjami językowymi powymieniać zasobami...
przykuta
IMO powiaty + miasta na prawach powiatu mogłyby mieć hasła o zabytkach. W przypadku miast, które nie są na prawach powiatu, a mają dużo zabytków - to jest kwestia skali (np. Wałbrzych ma ich bardzo dużo). No, można by zrobić botem rozeznanie :)
Ciekawe rozróżnienie - Wałbrzych jest ze 3 razy większy od Sopotu; ile zabytków jest w Sopocie? Ten drugi jest miastem na prawach powiatu...
Picus viridis
Ciekawe rozróżnienie - Wałbrzych jest ze 3 razy większy od Sopotu; ile zabytków jest w Sopocie? Ten drugi jest miastem na prawach powiatu...
Picus viridis
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy/wojew%C3%B...
----- Original Message ----- From: "Powerek38"
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta:
http://www.catholic-hierarchy.org/bishop/bgreger.html
Z biografiami może być za mało danych (?), ale może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Takie listy mamy w zasadzie tylko dla terenów Polski (dawnej i obecnej), z innych państw sporadycznie.
Gytha
W dniu 25 października 2011 08:19 użytkownik Gytha gyda.ogg@gmail.com napisał:
może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Wydaje mi się, że bez problemu. Wyciągnąć z list "Affiliated Bishops" imiona, nazwiska i daty roczne (dzienne?) dla osób opisanych jako Auxiliary Bishop / Bishop / Archbishop i odpowiednio posortowane wg dat wstawić do tabelki, pod nagłówki jak w Biskupach krakowskich. Biskupów pomocniczych z czasów diecezji / archidiecezji można chyba podzielić wg dat z tabeli Historical Summary.
Polskich nazw diecezji można szukać np. poprzez interwiki z en ;)
Problemem byłoby ew. ujednoznacznianie biskupów - gdyby utworzyć bazę przymiotników ;), to mógłbym wstawiać linki typu Imię (biskup krakowski), ale np. w Saragossie było dwóch Juanów de Aragón (z Aragonii?) i nie wiem, jak z tym sobie poradzić.
Czy są jeszcze jakieś interesujące nas przypadki? W tej bazie jest też funkcja Titular Bishop, trzeba by ją podobnie rozróżniać?
-- Matma Rex
Hej!
Co do propozycji Gythy - jestem za. Biskupów tytularnych też warto byłoby wyciągnąć, bo ostatnio w dyskusji w Projekcie Chrześcijaństwo ustalono, że stolice tytularne są autoency, więc gdybyśmy mieli listy biskupów zasiadających na każdej z nich, to już znacznie łatwiej i szybciej można by dopisać resztę hasła (głównie informacje, gdzie znajdowała się ta stolica - te informacje są w innej bazie, gcatholic.com, ale mając listę to już naprawdę można dość szybko wstawić ręcznie).
Jeśli chodzi o biogramy poszczególnych biskupów, ja sobie to wyobrażałem z grubsza tak (mogę to rozwinąć na jakiejś podstronie w mojej osobistej przestrzeni, ale na razie tak poglądowo): ta baza operuje kilkunastoma standardowymi formułkami dotyczącymi "etapów w karierze" biskupa, zapisanymi w tabelce na jego podstronie w bazie. Jeśli bot potrafi przerobić zapis dat (np. 8 Dec 1935 na 8 grudnia 1935), to możemy łatwo stworzyć wzorzec przekształcania poszczególnych formułek z bazy na gotowe zdania do tworzenia biogramu, na zasadzie puzzli. Kilka przykładów: "Ordained Priest" - > [Data] przyjął święcenie kapłańskie; "Appointed Auxiliary Bishop" - [data] został mianowany biskupem pomocniczym [dopełniacz diecezji]; "Ordained Bishop" - [data] przyjął sakrę.
Nie wiem, czy bot byłby w stanie coś takiego zrobić. Oczywiście, aby to w pełni działało, należałoby mieć w mianowniku i dopełniaczu nazwy wszystkich diecezji. Ale to też można rozwiązać - albo stworzyć taką tabelkę wcześniej, albo po prostu pozostawić to (poza przestrzenią główną albo oznaczone jakimś szablonem) do ręcznego skorygowania.
To na razie taka moja luźna wizja oderwana od technikaliów - pytanie, czy w jakimkolwiek stopniu wykonalna.
Powerek38
W dniu 2011-10-25 20:17, Bartosz Dziewoński pisze:
W dniu 25 października 2011 08:19 użytkownik Gythagyda.ogg@gmail.com napisał:
może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Wydaje mi się, że bez problemu. Wyciągnąć z list "Affiliated Bishops" imiona, nazwiska i daty roczne (dzienne?) dla osób opisanych jako Auxiliary Bishop / Bishop / Archbishop i odpowiednio posortowane wg dat wstawić do tabelki, pod nagłówki jak w Biskupach krakowskich. Biskupów pomocniczych z czasów diecezji / archidiecezji można chyba podzielić wg dat z tabeli Historical Summary.
Polskich nazw diecezji można szukać np. poprzez interwiki z en ;)
Problemem byłoby ew. ujednoznacznianie biskupów - gdyby utworzyć bazę przymiotników ;), to mógłbym wstawiać linki typu Imię (biskup krakowski), ale np. w Saragossie było dwóch Juanów de Aragón (z Aragonii?) i nie wiem, jak z tym sobie poradzić.
Czy są jeszcze jakieś interesujące nas przypadki? W tej bazie jest też funkcja Titular Bishop, trzeba by ją podobnie rozróżniać?
-- Matma Rex
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Przed chwilą coś takiego znalazłem na ru wiki: http://tinyurl.com/67sgr92 [[ru:Википедия:Проект:Заливка новых статей]] i przykład - rzeki Rosji http://tinyurl.com/5w2nmet przykuta
Przed chwilą coś takiego znalazłem na ru wiki: http://tinyurl.com/67sgr92 [[ru:Википедия:Проект:Заливка новых статей]]
Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, pogratulujmy Hiszpanom:
http://es.wikipedia.org/wiki/Wikipedia:Caf%C3%A9/Portal/Archivo/Noticias/Act...
przykuta
No czas włączyć autobooota i zabierać się do pisania nowych haseł. :)
Pablo000
W dniu 29 października 2011 14:08 użytkownik Przykuta przykuta@o2.plnapisał:
Przed chwilą coś takiego znalazłem na ru wiki:
[[ru:Википедия:Проект:Заливка новых статей]]
Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, pogratulujmy Hiszpanom:
http://es.wikipedia.org/wiki/Wikipedia:Caf%C3%A9/Portal/Archivo/Noticias/Act...
przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
i przykład - rzeki Rosji http://tinyurl.com/5w2nmet
W Rossyi riek mnogo... Tylko jeden drobiazg - ile osób zagląda do artykułów pisanych przez boty?
Przypominam, że nie mamy co najmniej połowy osób opisanych w Polskim Słowniku Biograficznym...
Picus viridis
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Przykuta | Sent: Saturday, October 29, 2011 2:08 PM / | Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, | pogratulujmy Hiszpanom:
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
Właśnie zauważyłem wątek na es wiki z pomocą translatora (czasem jednak się przydaje), że chcą zapytać Holendrów o wypożyczenie botów/baz danych. Jeśliby te stuby pisane przez nl boty były dla nas satysfakcjonujące - to oczywiście można by się bazami danych powymieniać. Można się powymieniać także z Włochami, Hiszpanami itd. Wszyscy na tym zyskamy, no nie? Właśnie sobie przejrzałem trochę stubów geograficznych pisanych kiedyś tam przez ludzi - bez źródeł itd. W tym względzie bocia robota wypada jednak lepiej. A że ma to sens:
http://pl.wikipedia.org/wiki/Wikiprojekt:Ilustrowanie/Francuskie_wioski
Nie tylko boty w nich grzebią potem.
BTW: http://pl.wikipedia.org/wiki/Wikipedysta:Svick/Dusty
Odłogiem u nas nie leży niewiele haseł mających więcej niż 5 lat ;)
Przykuta
| Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, | pogratulujmy Hiszpanom:
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
No i Holendrzy dogonili Włochów
przykuta