Boty to mocno dyskusyjna sprawa, ale ten szwedzki bot, Lsjbot, który wypluwa z siebie 5000 haseł dziennie, a wyprodukował do tej pory 400.000+ haseł i działa dalej, to jak się wydaje inna sprawa.
Przykładowa twórczość Lsjbota (w historii oprócz mnie wszystko to boty) http://sv.wikipedia.org/wiki/L%C3%A5ngstj%C3%A4rtad_bredn%C3%A4bb
Jak tak ma wyglądać twórczość botowa to jestem za.
Pozdrowienia, Kpjas Krzysztof P. Jasiutowicz
Rzeczywiscie, naprawde bardzo dobrze to wyglada. Ze szwedzkim Lsjbotem na sluzbie pl-Wiki moglibysmy juz zaczac chlodzic tego szampana:) Ale oczywiscie to prosba-pytanie to tej waskiej grupy osob sposrod nas, ktora posiada wiedze technicza, jak to zrobic, prawda?
Wracajac jeszcze na chwile do kwestii milionowego artykulu: pewnie warto napisac w informacji prasowej dla PAP, jaki konkretnie artykuł byl artykulem nr 1 000 000. Patrzac na kolegow ze Szwecji, motyl Erysichton elaborata z rodziny modraszkowatym brzmi sympatycznie i intrygujaco (chociaż juz informacja, ze zostal napisany przez bota, a nie czlowieka, moglaby zaniepokoic polska opinie publiczna:))
Czy autor milionowego artykułu na pl-Wiki tez zostanie w jakis sposob wyrozniony/uhonorowany/nagrodzony? Jak to sie odbywalo w innych krajach?
Mysle, ze warto byloby, zeby ten miliony był fajnym, merytorycznym artykulem przynajmniej na poziomie czywiesza, wiec moze warto byloby wprowadzic jakas pozytywna, kladaca nacisk na jakosc, rywalizacje? Pomysl Polimerka jest bardzo fajny, tylko wyzwaniem bedzie moim zdaniem oszacowanie dokladnie dnia, kiedy to sie stanie. Na pewno wiele osob bedzie chcialo przejsc do historii polskiej Wikipedii i napisac ten milionowy artykul, i w ostatnich dniach mozemy spodziewac sie fluktuacji w ilosci pisanych artykułów.
Pozdrawiam serdecznie, Adrian (Boston9)
On 06/17/2013 10:38 PM, Adrian Grycuk wrote:
Boty to mocno dyskusyjna sprawa, ale ten szwedzki bot, Lsjbot, który wypluwa z siebie 5000 haseł dziennie, a wyprodukował do tej pory 400.000+ haseł i działa dalej, to jak się wydaje inna sprawa.
Przykładowa twórczość Lsjbota (w historii oprócz mnie wszystko to boty) http://sv.wikipedia.org/wiki/L%C3%A5ngstj%C3%A4rtad_bredn%C3%A4bb
Jak tak ma wyglądać twórczość botowa to jestem za.
Pozdrowienia, Kpjas Krzysztof P. Jasiutowicz
Rzeczywiscie, naprawde bardzo dobrze to wyglada. Ze szwedzkim Lsjbotem na sluzbie pl-Wiki moglibysmy juz zaczac chlodzic tego szampana:) Ale oczywiscie to prosba-pytanie to tej waskiej grupy osob sposrod nas, ktora posiada wiedze technicza, jak to zrobic, prawda?
Wracajac jeszcze na chwile do kwestii milionowego artykulu: pewnie warto napisac w informacji prasowej dla PAP, jaki konkretnie artykuł byl artykulem nr 1 000 000. Patrzac na kolegow ze Szwecji, motyl Erysichton elaborata z rodziny modraszkowatym brzmi sympatycznie i intrygujaco (chociaż juz informacja, ze zostal napisany przez bota, a nie czlowieka, moglaby zaniepokoic polska opinie publiczna:))
Czy autor milionowego artykułu na pl-Wiki tez zostanie w jakis sposob wyrozniony/uhonorowany/nagrodzony? Jak to sie odbywalo w innych krajach?
Mysle, ze warto byloby, zeby ten miliony był fajnym, merytorycznym artykulem przynajmniej na poziomie czywiesza, wiec moze warto byloby wprowadzic jakas pozytywna, kladaca nacisk na jakosc, rywalizacje? Pomysl Polimerka jest bardzo fajny, tylko wyzwaniem bedzie moim zdaniem oszacowanie dokladnie dnia, kiedy to sie stanie. Na pewno wiele osob bedzie chcialo przejsc do historii polskiej Wikipedii i napisac ten milionowy artykul, i w ostatnich dniach mozemy spodziewac sie fluktuacji w ilosci pisanych artykułów.
Pozdrawiam serdecznie, Adrian (Boston9)
Adrian, między innymi do tego celu działją mój licznik http://tools.wikimedia.pl/~masti/articles.html
podaje numer artykułu w momencie utworzenia.
ale z tego co pamiętam był pomysł by nagrodzić autora najlepszego artykułu ok 1M a nie ten jeden.
masti
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of masti | Sent: Monday, June 17, 2013 11:28 PM / | między innymi do tego celu działją mój licznik | http://tools.wikimedia.pl/~masti/articles.html | | podaje numer artykułu w momencie utworzenia.
Marku, a gdzie jest opisany/dostępny algorytm twojego licznika?
Z uszanowaniem, Janusz "Ency" Dorożyński
On 06/18/2013 11:13 AM, Dorożyński Janusz wrote:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of masti | Sent: Monday, June 17, 2013 11:28 PM / | między innymi do tego celu działją mój licznik | http://tools.wikimedia.pl/~masti/articles.html | | podaje numer artykułu w momencie utworzenia.
Marku, a gdzie jest opisany/dostępny algorytm twojego licznika?
Z uszanowaniem, Janusz "Ency" Dorożyński
miał być ale ciągle nie mam czasu :)
Algorytm jest prosty Bot obserwuje kanał IRC z ostatnimi zmianami czyli #pl.wikipedia na irc.wikimedia.org. Jeśli znajdzie znacznik nowego artykułu to pobiera informację z pl.wiki o aktualnym numerze artykułu i zapisuje to do logu. Log jest następnie przekształcany na HTML i wyświetlany.
Goły log jest dostępny pod adresem: http://tools.wikimedia.pl/~masti/articles.log
widoczne powtórzenia numerów wynikają z kasowania artykułów. Bot reaguje tylko na nowe artykuły w przestrzeni głównej. Algorytm nie jest doskonały bo nie ma w mediaWiki sensownego systemu numeracji artykułów.
Tak nprawdę myślałem o jakiejś innej metodzie ale niestety nie bardzo mam czas się tym zająć.
masti
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of masti | Sent: Tuesday, June 18, 2013 8:11 PM / | miał być ale ciągle nie mam czasu :)
:-))
| Algorytm jest prosty ...
W zasadzie sporo jest jasne.
/ | Bot ... pobiera informację z pl.wiki o aktualnym numerze artykułu
A gdzie to jest?
Z uszanowaniem, Janusz "Ency" Dorożyński
i zapisuje to do logu. | Log jest następnie przekształcany na HTML i wyświetlany. | | Goły log jest dostępny pod adresem: | http://tools.wikimedia.pl/~masti/articles.log | | widoczne powtórzenia numerów wynikają z kasowania artykułów. | Bot reaguje tylko na nowe artykuły w przestrzeni głównej. | Algorytm nie jest doskonały bo nie ma w mediaWiki sensownego systemu | numeracji artykułów. | | Tak nprawdę myślałem o jakiejś innej metodzie ale niestety nie bardzo mam czas | się tym zająć. | | masti | | | _______________________________________________ | Lista dyskusyjna WikiPL-l | WikiPL-l@lists.wikimedia.org | https://lists.wikimedia.org/mailman/listinfo/wikipl-l
On 06/18/2013 11:46 PM, Dorożyński Janusz (4w) wrote:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of masti | Sent: Tuesday, June 18, 2013 8:11 PM / | miał być ale ciągle nie mam czasu :)
:-))
| Algorytm jest prosty ...
W zasadzie sporo jest jasne.
/ | Bot ... pobiera informację z pl.wiki o aktualnym numerze artykułu
A gdzie to jest?
Z uszanowaniem, Janusz "Ency" Dorożyński
dane pobierane sa przez API w momencie zauważenia nowego artykułu. API zwraca dane w postaci XMLa <api><query><statistics pages="1920708" articles="973130" edits="37433811" images="0" users="563341" activeusers="4879" admins="150" jobs="2838"/></query></api>
z tego bot wybiera articles="973130" i to jest aktualna liczba artykułów
nie ma możliwości późniejszego pobrania liczby artykułów w momencie utworzenia. MediaWiki nie udostepnia takiej funkcjonalności.
masti
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of masti | Sent: Wednesday, June 19, 2013 12:40 AM / | dane pobierane sa przez API w momencie zauważenia nowego artykułu. API | zwraca dane w postaci XMLa <api><query><statistics pages="1920708" | articles="973130" | edits="37433811" images="0" users="563341" activeusers="4879" | admins="150" jobs="2838"/></query></api> | | z tego bot wybiera articles="973130" i to jest aktualna liczba artykułów | | nie ma możliwości późniejszego pobrania liczby artykułów w momencie | utworzenia. MediaWiki nie udostepnia takiej funkcjonalności.
Ok. To jest słabe miejsce metodyki, ale faktycznie nic na to da się poradzić. Dlatego też mam taką opinię, którą wyraziłem w odpowiedzi na list Magalii.
Z uszanowaniem, Janusz "Ency" Dorożyński
On 06/17/2013 10:38 PM, Adrian Grycuk wrote:
Boty to mocno dyskusyjna sprawa, ale ten szwedzki bot, Lsjbot, który wypluwa z siebie 5000 haseł dziennie, a wyprodukował do tej pory 400.000+ haseł i działa dalej, to jak się wydaje inna sprawa.
Przykładowa twórczość Lsjbota (w historii oprócz mnie wszystko to boty) http://sv.wikipedia.org/wiki/L%C3%A5ngstj%C3%A4rtad_bredn%C3%A4bb
Jak tak ma wyglądać twórczość botowa to jestem za.
Pozdrowienia, Kpjas Krzysztof P. Jasiutowicz
Rzeczywiscie, naprawde bardzo dobrze to wyglada. Ze szwedzkim Lsjbotem na sluzbie pl-Wiki moglibysmy juz zaczac chlodzic tego szampana:)
tak na marginesie trudności botowania okzuje sie, że 1M artykuł na sv.wiki jest oparty na nieaktualnych źródła a gatunek, który opisuje został inaczej sklasyfkowany.
Kopi posta Kurta Kulaca z Wikimedi-l
i don´t want to repeat all those arguments already quoted (lennard already mentioned achim raschkas criticism, which i fully agree with), since what happend, already happend, and will unstoppably happen in the future. but i would say first of all the strategic goal is not to contribute hundreds of mistakes a day. just to take the 1 millionth article Erysichton elaborata: after an advice on the talk page a HUMAN added, that the species is probably synonymized with Erysichton palmyra. so far, so good. but even this correction is not enough. in 2010 the genus erysichton was redefined and a new genus, jameela was described. both taxa now desrcibed as in sv.wikipedia are invalid.
so just concerning this tiny tiny group of articles, there is already a bunch of mistakes, the bot copied out of outdated databases. wouldn´t be a big deal, if somebody mentioned that the articles sticked to the old view. but that´s something a bot can´t handle. so how reliable is the rest of the articles?
a bot can be a convenient helper for authors, who know, how to handle it, as it seems has happened with the creation of the articles about swedish lakes (i´m no expert with that though). but it is a desastrous tool for our whole movement, if you create hundreds of thousands (!) articles, without the slightest idea, how to handle the contradictions, that will appear doubtlessly?
it´s a sad thing, that you mention quality and this action in one centence...
truly utterly disappointed encyclopedic greetings, kurt