[Wikipl-l] Wikipedia jako korpus języka polskiego

Tomasz Ganicz polimerek w gmail.com
Nie, 9 Wrz 2007, 20:22:21 UTC


09-09-07, Michał Kosmulski <michal.kosmulski w netsprint.pl> napisał(a):

> Istnieje obecnie kilka dużych korpusów języka polskiego, ale o ile wiem, wszystkie
> mają dość restrykcyjne licencje. Na przykład korpus IPI PAN można przeglądać za
> pomocą narzędzi dostępnych na licencji GPL (chwała im za to), ale sam korpus jako
> zbiór danych podlega takiej licencji, że nawet nie wolno przekonwertować danych na
> inny format nie mówiąc już o innych swobodach jak rozpowszechnianie czy
> modyfikacja.

Kiedyś właśnie korpus IP PAN się do nas zwrócił, żeby włączyć do nich
Wikipedię. Niestety nie doszło do tego - ze względu na problemy
licencyjne. O ile mnie pamięć nie myli było to pod koniec 2005 r.
Zwracaliśmy się z tym problemem do amerykańskiej Fundacji Wikimedia
wtedy i oni uznali, że niestety się nie da.

-- 
Tomek "Polimerek" Ganicz
http://pl.wikimedia.org/wiki/User:Polimerek
http://www.poli.toya.net.pl
http://www.ptchem.lodz.pl/en/TomaszGanicz.html


Więcej informacji o liście dyskusyjnej WikiPL-l