[Wikipl-l] Wikipedia jako korpus języka polskiego

Gemma studio w gemma.edu.pl
Pon, 10 Wrz 2007, 15:06:19 UTC


> Może się zdziwisz, ale oni mieli pełną świadomość tego. Mieli zamiar
> Tomek "Polimerek" Ganicz


To dobrze. Jednak ludzie, którzy znają się na języku i potrafią z niego
zawodowo korzystać w celach naukowych, na pewno wiedzą o Wikipedii, zatem
nasza oferta byłaby do nich skierowana niepotrzebnie.

Natomiast pomysł autora wątku był taki, aby tę wiadomość o możliwości
wykorzystania nas jako korpusu rozpropagować, a wtedy trafiłoby to do ludzi,
do których nie powinno trafić. Strach pomyśleć chociazby o amatorskich
spellcheckerach. Z kolei do pewnych statystyk świetnie nadaje się np.
http://www.kurnik.pl/slownik/.

Podam kilka przykładów nietypowości Wikipedii:

- Rzeczypospolitej (z literą 'y') w rozumieniu republiki a nie gazety - mamy
skrajną areprezentatywność.
- Wojny, Bitwy, Powstania itp. - pisane wielką literą są u nas tylko na
początku zdania - jw.
- Ostatnia akcja usuwania skrótu pw. z haseł - jw.

Przykładów można mnożyć w setki, jeśli nie w tysiące.

Podsumuję więc: Wykształceni językoznawcy o możliwościach Wikipedii wiedzą.
Reszta nie powinna być zachęcana do wykorzystywania jej od strony naukowej w
zakresie językowym.

Beno




Więcej informacji o liście dyskusyjnej WikiPL-l