23-10-07, Tomasz Ganicz polimerek@gmail.com napisał(a):
Jak będziemy mieli 10 milionów haseł i np: w tym 1000 artykułów o różnych Janach Kowalskich - to znalezienie w tym gąszczu tego jednego, którego się szuka stanie się problemem. Aktualnie Wikipedia jest wciąż wbrew pozorom stosunkowo małą bazą danych (w porównaniu chociażby z bazą danych ZUS, czy Chemical Abstracts). Początki tych problemów już jednak widać w anglojęzycznej Wikipedii - a z czasem będą one rosły.
Raczej wiekszą bazą danych (w GB) natomiast o mniejszej liczbie rekordów ;) Raczej sytuacja z 1000 Janów Kowalskich jest nieunikniona - skasowanie nie-noblistów nazywających się Jan Kowalski to nie jest jednak metoda ;)
Popatrz chociażby na to:
http://en.wikipedia.org/wiki/Famous_people_with_the_surname_Smith, a potem jeszcze kliknij na:
http://en.wikipedia.org/wiki/Thomas_Smith
czy
http://en.wikipedia.org/wiki/John_Smith_%28disambiguation%29
Problem nie do przeskoczenia, jeżeli dużo ludzi nazywa się tak samo - widać po prostu, że system Imię i Naziwsko się nie spełnia w XXI wieku. Może czas wymusić, aby ludzie podpisywali się Imię Drugie imię Nick Naziwsko :P
Śmieszna rzecz, że w podobnej sytuacji znalazłem matematyka o popularnym nazwisku na angielskiej wikipedii i dopiero z niej wróciłem na polską, bo na pl.wiki nie mamy disambigów nazwisk (co jest koszmarną porażką wobec tragicznej wyszukiwarki ;)
Zabawny obrazek "antyinklozjonistyczny" jest tutaj:
http://commons.wikimedia.org/wiki/Image:Size_of_English_Wikipedia_broken_dow...
Zabawny to on faktycznie jest. Natomiast nie dostrzegam w nim nic antyinkluzjonistycznego - po prostu w zabawny sposób podkreśla jaka jest świadomość ludzi o treści Wikipedii.
<kasandra_głosi> W pewnym momencie na 100% okaże się, że jeśli nie zostanie zaprowadzony pewien porządek w tym mocno chaotycznie rozrastającym się źródle informacji - stanie się on praktycznie bezużyteczny. Ew. pewnym rozwiązaniem będzie się mogło okazać podzielenie Wikipedii na działy tematyczne z osobnymi regułami inkluzjonizmu w każdym. </kasandra_glosi>
Porządek nie może polegać na wycinaniu treści - musi być metodą organizacji danych, bo inaczej pewnego dnia ''nasza'' wikipedia będzie tylko mniejszą siostrą niecenzurowanej innej wersji :(
Pozdro AJF/WarX