08-05-07, Witek1988 witekthc@witekkrypczyk.info napisał(a):
Zwłaszcza, że te dane nie są potrzebne wikipedii, a firmie która pewnie nawet nie opublikuje tego co uda się jej z tego wydobyć.
Jeśli mamy robić coś w tym kierunku, lepiej sami wydobędźmy z tego takie dane i opublikujmy je na licencji LGPL. Może by założyć jakiś wikiprojekt wydobywający tego typu dane? Jeśli netsprint byłby skłonny nam w tym pomóc, to było by jeszcze lepiej, tak czy tak mógłby z tego korzystać.
Taki projekt już jest - istnieje program o nazwie Synarcher - który tworzy listy synonimów i mapy powiązań między artykułami w dowolnym wiki bez konieczności stosowania jakichś ekstra szablonów.
http://synarcher.sourceforge.net/
Ludzie z synarcher planują zrobić słownik wyrazów bliskoznacznych na bazie powiązań między artykułami w Wikipedii-en.