Klejny pomysł na automatyczne stuby to wykorzystać bazę danych ACS Registry i przerobić na artykuły informacje o wszystkich 25,788,694 znanych obecnie związków chemicznych :-) Ktoś na to czasem nie wpadł już na Wiki-en ? Co prawda CAS registry jest objęte copyrightem - ale podstawowych danych o związkach chemicznych (wzór sumaryczny, nazwa systematyczna, temperatury przemian fazowych itd) nie da się objąć copyrightem ;-)
Każdy powie 25 milionów - absurd, jednak być może kiedyś, w odległej przyszłości przestanie to być absurdem. Jak na razie na przeszkodzie stoją: ograniczenia techniczne serwerów oraz oprogramowania Wikipedii, które właściwie jest dobre dla encyklopedii <100 000 artykułów. Gdyby oprogramowanie Wiki umożliwiało...: 1. Tworzenie artykułów o tych samych nazwach i rozróżniałoby je ze względu na kategorie 2. W wynikach wyszukiwania był by podział na kategorie (tak jak na Allegro) 3. Wyniki wyszukiwania byłyby posortowane ze względu na popularność hasła (ilość odwiedzin dla hasła).
...to ja bym w ogóle nie widział problemu z dodaniem 35 mln. haseł.
Niestety, nie jest tak i dodawanie tysięcy nowych wsi spowoduje dłuższe listy disambig (jest 15 wsi o nazwie "Cegielnia"!), a to z kolei spowoduje dyskusje nad tym, czy wyróżniać któryś z artykułów jako ten podstawowy, czy nie. A właśnie odnośnie cegielni: http://pl.wikipedia.org/wiki/Cegielnia. jaki jest sens trzymać na na Wikipedii wsię, która nigdy nie miała nawet 1000 mieszkańców?
Moja propozycja taka: ustalić jakąś minimalną liczbę mieszkańców wsi i żeby bot dodawał tylko wsie np. powyżej 3 000 mieszkańców