Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
_______________________________________________ Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
hát, ebből az elsőnek meg a negyediknek elég minimális az információtartalma. infoboxxal ellátott szubcsonkokat ne gyártsunk tömegesen.
On Fri, Jan 11, 2013 at 5:53 PM, Bence Damokos bdamokos@gmail.com wrote:
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wow. Nem vagyok híve a botos dolgoknak, de ha kisbolygókat lehet, akkor ilyet is lehet, feltéve, hogy tényleg korrekt adatokkal dolgozik. Szerintem megcsinálhatnánk mi is.
T
2013/1/11 Bence Damokos bdamokos@gmail.com
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
On Fri, Jan 11, 2013 at 6:59 PM, Timea B teemeah.wikiposta@gmail.comwrote:
Wow. Nem vagyok híve a botos dolgoknak,
most a botos jeti szomorú…
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne. Ha értelmesen le lehet valahogy korlátozni pártízezer cikkre (pl. Magyarországon megtalálható fajok, legelterjedtebb fajok, veszélyeztetett fajok), úgy jó ötletnek hangzik.
On Fri, Jan 11, 2013 at 6:59 PM, Timea B teemeah.wikiposta@gmail.comwrote:
Wow. Nem vagyok híve a botos dolgoknak, de ha kisbolygókat lehet, akkor ilyet is lehet, feltéve, hogy tényleg korrekt adatokkal dolgozik. Szerintem megcsinálhatnánk mi is.
T
2013/1/11 Bence Damokos bdamokos@gmail.com
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Arról nem beszélve, hogy a fajok, mivel nem önmagában állnak, hanem az emberek fejében léteznek, nem annyira jól lehatárolt dolgok, mint pl. a kisbolygók. Szokott változni a fajok neve, kiderül róluk, hogy nem is faj, csak alfaj, vagy hogy hatan leírták ugyanazt a fajt különbözőképpen... szóval kár lenne automatizáltan rászabadítani a wikire szerintem.
syp
On Sat, Jan 12, 2013 at 10:26 AM, Tisza Gergő gtisza@gmail.com wrote:
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne. Ha értelmesen le lehet valahogy korlátozni pártízezer cikkre (pl. Magyarországon megtalálható fajok, legelterjedtebb fajok, veszélyeztetett fajok), úgy jó ötletnek hangzik.
On Fri, Jan 11, 2013 at 6:59 PM, Timea B teemeah.wikiposta@gmail.comwrote:
Wow. Nem vagyok híve a botos dolgoknak, de ha kisbolygókat lehet, akkor ilyet is lehet, feltéve, hogy tényleg korrekt adatokkal dolgozik. Szerintem megcsinálhatnánk mi is.
T
2013/1/11 Bence Damokos bdamokos@gmail.com
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Sziasztok!
Szerintem se gyártassunk bottal tömegesen szubcsonk cikkeket a Wikipédiára, mert nagyon sok fajról többet bottal úgyse tudnánk írni. Néhány fontos kategória az jól jöhet, ahogy az fentebb elhangzott, Magyarország élővilága, védett fajok, veszélyeztettet fajok, de több nem kell. Itt is persze problémát jelenthetnek a duplikációk, az alfajok cikkei, a fajok nevének helyes magyar fordítása, a szubcsonkok, csonkok, stb. Ezzel majd lesz dolgunk, de érdemes belevágni, mert ettől lesz tartalmas és informatív az enciklopédia. Lehet, majd szócikkíró (karbantartó) versenyt hirdetni a bot által létrehozott cikkek fejlesztésére.
Az összes faj magyar nyelvű szócikkét pedig a Wikispecies-re (Wikifajok) kéne feltölteni, oda való. És ott a szubcsonkoknak is örülök, majd fejlődnek, ahogy tudnak. A Wikispecies magyar kezdőlapot és az irányelvek fordításait csinálom, ahogy időm engedi. A bot szerintem megfelelő utasításokkal elég szépen meg tudja csinálni (helyettünk) a kimondottan erre szakosodott társprojektet.
A magyar Wikifjok logója: http://commons.wikimedia.org/wiki/File:Wikispecies-logo-hu.JPG A kezdőlap vázlata: http://hu.wikipedia.org/wiki/Szerkeszt%C5%91:Matteo55/Wikifajok
Üdv, Matteo
Én annak sem örülnék, ha a szócikkek 85%-a legkiválóbb szakértők féltő gonddal megírt hagyományos szócikke lenne. Szerintem az a jó, ha kiegyensúlyozott a témák feldolgozottsága a Wikipédiában.
A
On Sat, Jan 12, 2013 at 4:26 AM, Tisza Gergő gtisza@gmail.com wrote:
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne.
Mondjuk azért egy szakértő egy témában manuális módszerrel 20 év alatt sem tud megírni 10. 000 szócikket, szóval attól nem kell tartani, hogy hirtelen a magyar wiki 85%-a mondjuk K-pop lesz vagy egyiptomi relikvia. :)
2013. január 12. 15:25 Andras Malatinszky írta, andras@aromo.net:
Én annak sem örülnék, ha a szócikkek 85%-a legkiválóbb szakértők féltő gonddal megírt hagyományos szócikke lenne. Szerintem az a jó, ha kiegyensúlyozott a témák feldolgozottsága a Wikipédiában.
A
On Sat, Jan 12, 2013 at 4:26 AM, Tisza Gergő gtisza@gmail.com wrote:
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne.
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Én is inkább a topológiai témájú cikkek mértéktelen elszaporodásától tartok. :-)
De komolyan: a lényeg az, hogy nem csak az a baj, ha a robotcikkek szubcsonkok lesznek (ezen elvileg segíthetünk azzal, ha jobb botot csinálunk, gazdagabb adatbázissal), hanem az is, ha aránytalan túlsúlyba kerül egy téma, mert éppen abból lehetett könnyen tömegesen cikket gyártani.
A.
2013/1/12 Timea B teemeah.wikiposta@gmail.com
Mondjuk azért egy szakértő egy témában manuális módszerrel 20 év alatt sem tud megírni 10. 000 szócikket, szóval attól nem kell tartani, hogy hirtelen a magyar wiki 85%-a mondjuk K-pop lesz vagy egyiptomi relikvia. :)
- január 12. 15:25 Andras Malatinszky írta, andras@aromo.net:
Én annak sem örülnék, ha a szócikkek 85%-a legkiválóbb szakértők féltő gonddal megírt hagyományos szócikke lenne. Szerintem az a jó, ha kiegyensúlyozott a témák feldolgozottsága a Wikipédiában.
A
On Sat, Jan 12, 2013 at 4:26 AM, Tisza Gergő gtisza@gmail.com wrote:
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne.
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Én se örülnék, de az ilyen korlátozást se tartom jó ötletnek. Az egyetemes tudást gyűjtjük, egy ritka ausztrál faj pont annyira fontos, mint a leggyakoribb magyar faj. Ami meg tényleg keresett téma, arról ne egy ilyen szubcsonkunk legyen, ami gyakorlatilag csak a rendszertani besorolást meg egy könyvlistát tartalmaz.
On Sat, Jan 12, 2013 at 10:26 AM, Tisza Gergő gtisza@gmail.com wrote:
Azért én nem örülnék, ha a szócikkek 85%-a bottal generált fajleírás lenne. Ha értelmesen le lehet valahogy korlátozni pártízezer cikkre (pl. Magyarországon megtalálható fajok, legelterjedtebb fajok, veszélyeztetett fajok), úgy jó ötletnek hangzik.
On Fri, Jan 11, 2013 at 6:59 PM, Timea B teemeah.wikiposta@gmail.comwrote:
Wow. Nem vagyok híve a botos dolgoknak, de ha kisbolygókat lehet, akkor ilyet is lehet, feltéve, hogy tényleg korrekt adatokkal dolgozik. Szerintem megcsinálhatnánk mi is.
T
2013/1/11 Bence Damokos bdamokos@gmail.com
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders
Wikimedia-l mailing list Wikimedia-l@lists.wikimedia.org Unsubscribe: https://lists.wikimedia.org/mailman/listinfo/wikimedia-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
On Sat, Jan 12, 2013 at 5:02 PM, Annie alensha@gmail.com wrote:
Én se örülnék, de az ilyen korlátozást se tartom jó ötletnek. Az egyetemes tudást gyűjtjük, egy ritka ausztrál faj pont annyira fontos, mint a leggyakoribb magyar faj. Ami meg tényleg keresett téma, arról ne egy ilyen szubcsonkunk legyen, ami gyakorlatilag csak a rendszertani besorolást meg egy könyvlistát tartalmaz.
Egyrészt attól még, hogy az egyetemes tudást gyűjtjük, nem lesz minden egyformán fontos (ezért vannak például nevezetességi szabályaink); amelyik fajról többen/gyakrabban szeretnének megtudni dolgokat, az fontosabb.
Másrészt pont azért, mert a bottal generált cikk alig tartalmaz olyan hasznos információt, amit ne lehetne megtalálni más weboldalakon, alapvetően nem az a célja, hogy legyen, hanem hogy valamiféle magot szolgáltasson, amit aztán a szerkesztők továbbírhatnak (anélkül, hogy pl. taxoboxokkal kellene bajlódniuk). Ez korlátozott mennyiségű cikknél működhet, milliósnál biztosan nem.
Jah, hát milliósra én se duzzasztanám ezekkel a cikkszámot, de ha lehet valami racionális határt szabni, vagy válogatni, hogy mit alkosson a bot, akkor szerintem mehetne. Egyébként a kisbolygók többsége se olyan, amit bárki magától felütne, hogy hű de kiváncsi vagyok a 234455678-as kisbolygóra. :)
2013. január 13. 10:14 Tisza Gergő írta, gtisza@gmail.com:
On Sat, Jan 12, 2013 at 5:02 PM, Annie alensha@gmail.com wrote:
Én se örülnék, de az ilyen korlátozást se tartom jó ötletnek. Az egyetemes tudást gyűjtjük, egy ritka ausztrál faj pont annyira fontos, mint a leggyakoribb magyar faj. Ami meg tényleg keresett téma, arról ne egy ilyen szubcsonkunk legyen, ami gyakorlatilag csak a rendszertani besorolást meg egy könyvlistát tartalmaz.
Egyrészt attól még, hogy az egyetemes tudást gyűjtjük, nem lesz minden egyformán fontos (ezért vannak például nevezetességi szabályaink); amelyik fajról többen/gyakrabban szeretnének megtudni dolgokat, az fontosabb.
Másrészt pont azért, mert a bottal generált cikk alig tartalmaz olyan hasznos információt, amit ne lehetne megtalálni más weboldalakon, alapvetően nem az a célja, hogy legyen, hanem hogy valamiféle magot szolgáltasson, amit aztán a szerkesztők továbbírhatnak (anélkül, hogy pl. taxoboxokkal kellene bajlódniuk). Ez korlátozott mennyiségű cikknél működhet, milliósnál biztosan nem.
Wikihu-l mailing list Wikihu-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikihu-l
2013/1/13 Timea B teemeah.wikiposta@gmail.com
Jah, hát milliósra én se duzzasztanám ezekkel a cikkszámot, de ha lehet valami racionális határt szabni, vagy válogatni, hogy mit alkosson a bot, akkor szerintem mehetne. Egyébként a kisbolygók többsége se olyan, amit bárki magától felütne, hogy hű de kiváncsi vagyok a 234455678-as kisbolygóra. :)
Nekem a kisbolygócikkek generálása nem volt túl rokonszenves, mindenesetre annyiban más tészta, hogy azok teljes cikkek: a kisbolygók nagy részéről nem sokat lehet mondani, és azt a keveset jól össze tudta szedni a bot. Ott nem szempont, hogy mekkora részük lesz aztán megírva rendesen, a fajoknál igen.
Óva intenék mindenkit attól, hogy a fürdővízzel a gyereket is kiöntse. Én úgy látom, hogy egy nagy lehetőségről van itt szó, ami számtalan egyébként majdan megírandó szócikk egyáltalán való elindulását nagyban segítené.
Kérdés, hogy hány oszlopa van annak az adatbázisnak, amiből az egyes lapokat a bot felépítené? (Vagyis mennyi adatot tartalmazna a cikk tárgyáról a cikk.) Illetve kérdés még, hogy ha nem az egészet, akkor mennyit lenne érdemes megcsináltatni így, és mik lennének a pontos preferáló szempontok, hogy melyeket?
Joey
Kár, hogy nem folytatódott ez a megbeszélés, pedig nagy lehetőségről van szó.
Egyes más Wikipédiákon már felismerték ezt, az egyéb kocsmafalra is érkezett erről hír: http://hu.wikipedia.org/wiki/Wikip%C3%A9dia:Kocsmafal_%28egy%C3%A9b%29#Waray...
Joey
2013/1/11 Bence Damokos bdamokos@gmail.com
Nem tudom mit szólnátok, ha a huwikin is lenne egy cikk minden létező fajról?
Üdv, Bence
---------- Forwarded message ---------- From: Anders Wennersten Date: Friday, January 11, 2013 Subject: [Wikimedia-l] Lsjbot has now started to generate 1-1, 5 M articles of species on sv:wp To: Wikimedia Mailing List wikimedia-l@lists.wikimedia.org
Inspired by the botgenerated articles of species made on nl:wp in late 2010 a colleague of mine, User:Lsj, started a similar project on sv:wp early 2012. By October 2012 his bot had generated some 65 000 articles, with essentially complete coverage of all fungi and birds.
He has since then extended the scope to include all living species, both animals and plants, which means another 1-1,5 million articles. Running at full permissible bot speed, the bot generates around 10,000 articles per day, but at a more realistic speed, the full project will take the rest of 2013 to complete.
The botcode has been written in a language-independent way, so that it can be ported to other language versions with only a modest effort. All language-specific text strings are in external files, so the code itself does not need changing between language versions. Beyond Swedish, the code has been tested on Cebuano wikipedia as well; full production on cebwp is ready to go, just awaiting community blessing there.
The source of the core of the data is taken from Catalogue of Life http://en.wikipedia.org/wiki/Catalogue_of_Life but the bot also checks with Commons, other languages(iwlinks) and other appropriate databases, such as the IUCN Redlist of endangered species.
The botcode is written in C# and uses the DotNetWikiBot framework.
Example articles: http://sv.wikipedia.org/wiki/Lichenopora_verrucaria http://sv.wikipedia.org/wiki/Phylactolaemata http://sv.wikipedia.org/wiki/Rundkrassing http://ceb.wikipedia.org/wiki/Sipunculidae http://ceb.wikipedia.org/wiki/Solaster_endeca
The full set of created articles (includes some other stuff as well, besides organisms): http://sv.wikipedia.org/wiki/Kategori:Robotskapade_artiklar http://ceb.wikipedia.org/wiki/Kategoriya:Paghimo_ni_bot My colleague is much too busy now to discuss himself just now, but I think it could be an inspiration for us all.
Besides Lsj himself there are about 10 users supporting him, with checking that the bot generate correct data etc, it has also been discussed extensively on our village pump etc Wikidata is as yet not used
The page where the project is discussed is just now (in Swedish of course..)
http://sv.wikipedia.org/wiki/Anv%C3%A4ndardiskussion:Lsjbot/Projekt_alla_art...
Anders