Í framhaldi af þessu vil ég skoða hvort tilefni sé til þess að endurbæta orðmyndasniðin svo þau styðji allar orðmyndir hvers orðs. Sem undirbúning ákvað ég að þýða þau atriði í IFD markamenginu ( http://linguist.is/icelandic_treebank/IFD_Tagset) sem gætu skipt máli. Það væri frábært ef einhver gæti farið yfir þýðinguna og látið mig vita, hvort sem það eru villur í henni eða ekki. Einnig hvort mörkin sem ég sleppti ættu samt að vera inni.
Hugmyndin er að meta hvort núverandi snið styðji allar þær orðmyndir sem eru mögulegar og ef ekki, bæta úr því. Svo ég taki einfalt dæmi, þá vitum við að nafnorð eru með kyn, tölu, fall og með möguleika á því að hafa greini. Við vitum að hvert nafnorð getur bara haft eitt kyn en geta verið í eintölu, fleirtölu; nefnifalli, þolfalli, þágufalli, eignarfalli; og með greini. Með því að fletta upp á nafnorðasniðunum sjáum við að skiptingin þar er fullnægjandi þó til séu tilvik þar sem ekki eru til orðmyndir í eintölu (feðgar) eða fleirtölu (sykur) og stundum á greinirinn ekki við (Stokkhólmur).
Nú er ég eingöngu áhugamaður um málfræði en ekki sérfræðingur. Þess vegna væri frábært ef einhver sæi sér fært að vera mér innan handar ef ég þarf að spyrja út í málfræðileg atriði eða hefði slatta af málfræðilegum skilgreiningum eins og t.d. "eingöngu sagnir í lýsingarhætti þátíðar fallbeygjast". Ef ekki, mælt með riti sem gæti hjálpað mér við þetta verkefni, helst einhverju sem er einfalt að fletta upp í.
RSVP.
- Svavar Kjarrval
On 03/03/13 17:09, Svavar Kjarrval wrote:
Hæ.
Þar sem það er ekki til listi fyrir íslenska Wiktionary sendi ég þetta hingað.
Var að spá hvort við ættum að byrja á því að skilgreina allar orðmyndir á orðasíðunum sjálfum í stað þess að vísa í sér orðmyndasíðu. Einn ókosturinn við það er ef orðið hefur nokkuð margar orðmyndir er að það gæti tekið mikið skjápláss. Á móti kemur að þeir þurfa ekki að fletta aftur eða athuga sérstaklega ef þær eru til eða ekki.
Hvað finnst ykkur?
Með kveðju, Svavar Kjarrval