W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Hello!
Sposób jest na bardzo prosty - musimy szukać baz danych w XLS czy innym podobnym formacie i przekazywać je, wraz z odpowiednim opracowaniem, naszym operatorom botów, żeby też tworzyli hasła. Może warto byłoby stworzyć osobną podstronę w przestrzeni Wikipedia, gdzie operatorzy chętnych botów (bo nie każdy bot umie zrobić coś takiego) przyjmowaliby takie pomysły i gdzie można by nad nimi dyskutować?
Poza tym istotnym problemem jest też umiejętność botów przetwarzania danych z innych źródeł niż XLS (np. z baz złożonych z plików HTML). Ja sam często działam na granicy pracy bota, to znaczy tworzę całe serie bardzo podobnych do siebie haseł, różniących się tylko zmiennymi w poszczególnych rubrykach, korzystając z rozmaitych baz danych (chociażby hasła o biskupach i diecezjach katolickich na podst. catholic-hierarchy.org). Pytanie tylko, czy boty dałyby sobie z tym radę.
Generalnie mam wrażenie (może bardzo subiektywne), że pomysłów trochę jest, ale brakuje nam wikipedystów o wystarczająco wysokim poziomie umiejętności technicznych. A często też np. tacy, za przeproszeniem, humaniści jak ja nie do końca wiedzą i rozumieją, jakie są granice możliwości np. bota czy skryptu.
Pozdrawiam!
Powerek38
W dniu 2011-10-24 14:04, Przykuta pisze:
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Popieram idee botowania nowych haseł. Czasem mam informacje o czymś i gdy brak chociażby stuba to trudno dobrać hasło do którego ta informacja pasuje. Mam nadzieje że znajdą się chętni by utworzyć botem wszystkie hasła które się da. Co z gwiazdami? Marek Mazurkiewicz
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykuta przykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Witam,
Dnia 24 października 2011 Bartosz Dziewoński napisał:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Pozdrawiam, Robert
W dniu 24 października 2011 16:27 użytkownik Robert Drózd rdrozd@sgh.waw.pl napisał:
Witam,
Dnia 24 października 2011 Bartosz Dziewoński napisał:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Jako baza danych samo MediaWiki jest w sumie trochę jak wbijanie mikroskopem gwoździ. W ramach Wiki Lubi Zabytki ludzie z Centrum:Polska zrobili taką wyszukiwarkę zabytków:
http://wikilubizabytki.centrumcyfrowe.pl/
ona potrafi np: pokazać wszystkie zabytkowe pałace w miejscowości "X" bez konieczności zabaw w kategoryzowanie...
Bazuje to bezpośrednio na spisach pozyskanych z Narodowego Instytutu Dziedzictwa.
Były próby podlinkowania w tym zasobów z Wikipedii i Commons - ale niestety panuje u nas i w spisach NID straszny bałagan terminologiczny, który uniemożliwia automatyczne zestrojenie jednego z drugim. Szczególnie złym pomysłem było stworzenie w Commons zasady, że jak zabytek ma swoją kategorię, to w opisach zdjęć usuwa się szablon z tymże numerem... W efekcie wiele zdjęć numerów w opisach nie ma...
U nas zbytki bardzo często nazywają się zupełnie inaczej niż w spisach NID, może dałoby się coś wykombinować bazując na samych numerach inwentarzowych - to by wymagało jednak bota, która by utworzył bazę typu: nr inwentarzowy -> nazwa zabytku w spisie NID -> nazwa hasła u nas -> lista zdjęć i/lub kategorii na Commons gdzie występuje numer inwentarzowy i następnie może dałoby się to zintegrować z tą wyszukiwarką z Centrum:Polska, która IMHO ma dużo większy sens niż ręczne tworzenie tabelek w Wikipedii, choć pewnie mając taką bazę dałoby się potem takie tabelki zrobić automatem.
Kolejny krok to by było dodanie do bazy geokoordynatów zabytków i rzucenie listy zabytków jako warstwy na mapy.
A czy były jakieś pomysły dalszego wykorzystania list, przygotowanych na potrzeby Wiki Lubi Zabytki?
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy
Artykuły w rodzaju "Lista zabytków w X" byłyby jak najbardziej encyklopedyczne i szalenie przydatne turystom, choć wymagałyby ręcznego podlinkowania wybranych zabytków.
Pozdrawiam, Robert
Pomysły były, ale to trzeba obgadać. Dla dużych miast można zrobić listy jako osobne artykuły, bo w hasłach o tych miastach się po prostu nie zmieszczą. Dla małych gmin, można tabelki wrzucić do haseł - bez ich wyodrębniania jako osobnych artykułów:
http://pl.wikipedia.org/wiki/Gmina_Ogrodzieniec#Zabytki
IMO powiaty + miasta na prawach powiatu mogłyby mieć hasła o zabytkach. W przypadku miast, które nie są na prawach powiatu, a mają dużo zabytków - to jest kwestia skali (np. Wałbrzych ma ich bardzo dużo). No, można by zrobić botem rozeznanie :)
http://pl.wikipedia.org/wiki/Dyskusja_Wikiprojektu:Wiki_Lubi_Zabytki#Botowan...
przykuta
IMO powiaty + miasta na prawach powiatu mogłyby mieć hasła o zabytkach. W przypadku miast, które nie są na prawach powiatu, a mają dużo zabytków - to jest kwestia skali (np. Wałbrzych ma ich bardzo dużo). No, można by zrobić botem rozeznanie :)
Ciekawe rozróżnienie - Wałbrzych jest ze 3 razy większy od Sopotu; ile zabytków jest w Sopocie? Ten drugi jest miastem na prawach powiatu...
Picus viridis
Ciekawe rozróżnienie - Wałbrzych jest ze 3 razy większy od Sopotu; ile zabytków jest w Sopocie? Ten drugi jest miastem na prawach powiatu...
Picus viridis
http://pl.wikipedia.org/wiki/Wikiprojekt:Wiki_Lubi_Zabytki/wykazy/wojew%C3%B...
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą odbędzie się już pewnie na Wiki: http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_bote...
Powerek38
W dniu 2011-10-24 16:50, masti pisze:
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
już się tym zająłem. Jak przygotuję botowalną tabelkę to dam znać
masti
On 10/24/2011 05:33 PM, Powerek38 wrote:
Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą odbędzie się już pewnie na Wiki: http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_bote...
Powerek38
W dniu 2011-10-24 16:50, masti pisze:
do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti
On 10/24/2011 04:36 PM, Powerek38 wrote:
Witam,
Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
Pozdrawiam!
Powerek38
W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł ze stroną do wrzucania różnych baz danych mi się podoba.
Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). Reasumując, podrzucaj wszystko ;-)
Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję gwarancji, ale zobaczę, co da się zrobić.
24.10.2011, Przykutaprzykuta@o2.pl napisał(a):
W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów bez źródeł, teraz robi to wiki holenderska:
http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
W tej chwili botują takie hasła:
http://nl.wikipedia.org/wiki/Ahnidzor
Ale wczoraj ładowali takie:
http://nl.wikipedia.org/wiki/Karaops_larryoo
http://nl.wikipedia.org/wiki/Boliscus_duricorius
http://nl.wikipedia.org/wiki/Zoramia_fragilis
Ze źródłami - na dwa (w porywach do trzy) boty
W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco ponad 760 000 haseł:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&old...
Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi wersjami językowymi.
Przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Te nl wiki stuby o gatunkach wyglądają przyzwoicie. A u nas wikiprojekt zoologiczny działa całkiem prężnie, choć nie wiem, kto czyta listę. Można by i im podrzucić, w końcu nl wiki nie powinna nas przegonić ;)
Elfhelm
Te nl wiki stuby o gatunkach wyglądają przyzwoicie. A u nas wikiprojekt zoologiczny działa całkiem prężnie, choć nie wiem, kto czyta listę. Można by i im podrzucić, w końcu nl wiki nie powinna nas przegonić ;)
Elfhelm
No, można by się miedzy wersjami językowymi powymieniać zasobami...
przykuta
----- Original Message ----- From: "Powerek38"
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta:
http://www.catholic-hierarchy.org/bishop/bgreger.html
Z biografiami może być za mało danych (?), ale może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Takie listy mamy w zasadzie tylko dla terenów Polski (dawnej i obecnej), z innych państw sporadycznie.
Gytha
W dniu 25 października 2011 08:19 użytkownik Gytha gyda.ogg@gmail.com napisał:
może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Wydaje mi się, że bez problemu. Wyciągnąć z list "Affiliated Bishops" imiona, nazwiska i daty roczne (dzienne?) dla osób opisanych jako Auxiliary Bishop / Bishop / Archbishop i odpowiednio posortowane wg dat wstawić do tabelki, pod nagłówki jak w Biskupach krakowskich. Biskupów pomocniczych z czasów diecezji / archidiecezji można chyba podzielić wg dat z tabeli Historical Summary.
Polskich nazw diecezji można szukać np. poprzez interwiki z en ;)
Problemem byłoby ew. ujednoznacznianie biskupów - gdyby utworzyć bazę przymiotników ;), to mógłbym wstawiać linki typu Imię (biskup krakowski), ale np. w Saragossie było dwóch Juanów de Aragón (z Aragonii?) i nie wiem, jak z tym sobie poradzić.
Czy są jeszcze jakieś interesujące nas przypadki? W tej bazie jest też funkcja Titular Bishop, trzeba by ją podobnie rozróżniać?
-- Matma Rex
Hej!
Co do propozycji Gythy - jestem za. Biskupów tytularnych też warto byłoby wyciągnąć, bo ostatnio w dyskusji w Projekcie Chrześcijaństwo ustalono, że stolice tytularne są autoency, więc gdybyśmy mieli listy biskupów zasiadających na każdej z nich, to już znacznie łatwiej i szybciej można by dopisać resztę hasła (głównie informacje, gdzie znajdowała się ta stolica - te informacje są w innej bazie, gcatholic.com, ale mając listę to już naprawdę można dość szybko wstawić ręcznie).
Jeśli chodzi o biogramy poszczególnych biskupów, ja sobie to wyobrażałem z grubsza tak (mogę to rozwinąć na jakiejś podstronie w mojej osobistej przestrzeni, ale na razie tak poglądowo): ta baza operuje kilkunastoma standardowymi formułkami dotyczącymi "etapów w karierze" biskupa, zapisanymi w tabelce na jego podstronie w bazie. Jeśli bot potrafi przerobić zapis dat (np. 8 Dec 1935 na 8 grudnia 1935), to możemy łatwo stworzyć wzorzec przekształcania poszczególnych formułek z bazy na gotowe zdania do tworzenia biogramu, na zasadzie puzzli. Kilka przykładów: "Ordained Priest" - > [Data] przyjął święcenie kapłańskie; "Appointed Auxiliary Bishop" - [data] został mianowany biskupem pomocniczym [dopełniacz diecezji]; "Ordained Bishop" - [data] przyjął sakrę.
Nie wiem, czy bot byłby w stanie coś takiego zrobić. Oczywiście, aby to w pełni działało, należałoby mieć w mianowniku i dopełniaczu nazwy wszystkich diecezji. Ale to też można rozwiązać - albo stworzyć taką tabelkę wcześniej, albo po prostu pozostawić to (poza przestrzenią główną albo oznaczone jakimś szablonem) do ręcznego skorygowania.
To na razie taka moja luźna wizja oderwana od technikaliów - pytanie, czy w jakimkolwiek stopniu wykonalna.
Powerek38
W dniu 2011-10-25 20:17, Bartosz Dziewoński pisze:
W dniu 25 października 2011 08:19 użytkownik Gythagyda.ogg@gmail.com napisał:
może dało by się stamtąd wyciągnąć chociaż listy biskupów danej diecezji i przerobić na coś takiego jak tutaj: http://pl.wikipedia.org/wiki/Biskupi_krakowscy
Przykładowa lista http://www.catholic-hierarchy.org/diocese/dzars.html
Trzeba by to chyba zrobić gdzieś poz główną przestrzenią, żeby potem ktoś (mogę np. ja ;-)) mógł zweryfikować nazwy miast (tzn. czy jest polski odpowiednik i czy można utworzyć przymiotnik) i poprzenosić.
Wydaje mi się, że bez problemu. Wyciągnąć z list "Affiliated Bishops" imiona, nazwiska i daty roczne (dzienne?) dla osób opisanych jako Auxiliary Bishop / Bishop / Archbishop i odpowiednio posortowane wg dat wstawić do tabelki, pod nagłówki jak w Biskupach krakowskich. Biskupów pomocniczych z czasów diecezji / archidiecezji można chyba podzielić wg dat z tabeli Historical Summary.
Polskich nazw diecezji można szukać np. poprzez interwiki z en ;)
Problemem byłoby ew. ujednoznacznianie biskupów - gdyby utworzyć bazę przymiotników ;), to mógłbym wstawiać linki typu Imię (biskup krakowski), ale np. w Saragossie było dwóch Juanów de Aragón (z Aragonii?) i nie wiem, jak z tym sobie poradzić.
Czy są jeszcze jakieś interesujące nas przypadki? W tej bazie jest też funkcja Titular Bishop, trzeba by ją podobnie rozróżniać?
-- Matma Rex
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Przed chwilą coś takiego znalazłem na ru wiki: http://tinyurl.com/67sgr92 [[ru:Википедия:Проект:Заливка новых статей]] i przykład - rzeki Rosji http://tinyurl.com/5w2nmet przykuta
Przed chwilą coś takiego znalazłem na ru wiki: http://tinyurl.com/67sgr92 [[ru:Википедия:Проект:Заливка новых статей]]
Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, pogratulujmy Hiszpanom:
http://es.wikipedia.org/wiki/Wikipedia:Caf%C3%A9/Portal/Archivo/Noticias/Act...
przykuta
No czas włączyć autobooota i zabierać się do pisania nowych haseł. :)
Pablo000
W dniu 29 października 2011 14:08 użytkownik Przykuta przykuta@o2.plnapisał:
Przed chwilą coś takiego znalazłem na ru wiki:
[[ru:Википедия:Проект:Заливка новых статей]]
Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, pogratulujmy Hiszpanom:
http://es.wikipedia.org/wiki/Wikipedia:Caf%C3%A9/Portal/Archivo/Noticias/Act...
przykuta
Lista dyskusyjna WikiPL-l WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Przykuta | Sent: Saturday, October 29, 2011 2:08 PM / | Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, | pogratulujmy Hiszpanom:
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
Właśnie zauważyłem wątek na es wiki z pomocą translatora (czasem jednak się przydaje), że chcą zapytać Holendrów o wypożyczenie botów/baz danych. Jeśliby te stuby pisane przez nl boty były dla nas satysfakcjonujące - to oczywiście można by się bazami danych powymieniać. Można się powymieniać także z Włochami, Hiszpanami itd. Wszyscy na tym zyskamy, no nie? Właśnie sobie przejrzałem trochę stubów geograficznych pisanych kiedyś tam przez ludzi - bez źródeł itd. W tym względzie bocia robota wypada jednak lepiej. A że ma to sens:
http://pl.wikipedia.org/wiki/Wikiprojekt:Ilustrowanie/Francuskie_wioski
Nie tylko boty w nich grzebią potem.
BTW: http://pl.wikipedia.org/wiki/Wikipedysta:Svick/Dusty
Odłogiem u nas nie leży niewiele haseł mających więcej niż 5 lat ;)
Przykuta
| Drogie wikipedystki, drodzy wikipedyści - nie bądźmy małostkowi, | pogratulujmy Hiszpanom:
I jeszcze bardziej Holendrom.
Pozdrowienia, Janusz "Ency" Dorożyński
No i Holendrzy dogonili Włochów
przykuta
i przykład - rzeki Rosji http://tinyurl.com/5w2nmet
W Rossyi riek mnogo... Tylko jeden drobiazg - ile osób zagląda do artykułów pisanych przez boty?
Przypominam, że nie mamy co najmniej połowy osób opisanych w Polskim Słowniku Biograficznym...
Picus viridis