[Wikipl-l] Wikipedia jako korpus języka polskiego
Gemma
studio w gemma.edu.pl
Pon, 10 Wrz 2007, 15:06:19 UTC
> Może się zdziwisz, ale oni mieli pełną świadomość tego. Mieli zamiar
> Tomek "Polimerek" Ganicz
To dobrze. Jednak ludzie, którzy znają się na języku i potrafią z niego
zawodowo korzystać w celach naukowych, na pewno wiedzą o Wikipedii, zatem
nasza oferta byłaby do nich skierowana niepotrzebnie.
Natomiast pomysł autora wątku był taki, aby tę wiadomość o możliwości
wykorzystania nas jako korpusu rozpropagować, a wtedy trafiłoby to do ludzi,
do których nie powinno trafić. Strach pomyśleć chociazby o amatorskich
spellcheckerach. Z kolei do pewnych statystyk świetnie nadaje się np.
http://www.kurnik.pl/slownik/.
Podam kilka przykładów nietypowości Wikipedii:
- Rzeczypospolitej (z literą 'y') w rozumieniu republiki a nie gazety - mamy
skrajną areprezentatywność.
- Wojny, Bitwy, Powstania itp. - pisane wielką literą są u nas tylko na
początku zdania - jw.
- Ostatnia akcja usuwania skrótu pw. z haseł - jw.
Przykładów można mnożyć w setki, jeśli nie w tysiące.
Podsumuję więc: Wykształceni językoznawcy o możliwościach Wikipedii wiedzą.
Reszta nie powinna być zachęcana do wykorzystywania jej od strony naukowej w
zakresie językowym.
Beno
Więcej informacji o liście dyskusyjnej WikiPL-l