<div dir="ltr"><div>I'm not sure where you're getting the numbers from; there are over 200,000 lexemes in Wikidata, with roughly a dozen languages having at least thousands of entries. Obviously it's incomplete, but quite a lot of effort has gone into it already. For most nouns, a sense can be linked to a regular Wikidata item that is about a particular concept (and this has been done in at least several languages for 10's of thousands of cases now, but again much more work is needed). One helper tool available to link lexeme senses and regular conceptual (language-independent) items is MachtSinn: <a href="https://machtsinn.toolforge.org/">https://machtsinn.toolforge.org/</a> - pick a language you know and help out!</div><div><br></div><div>   Arthur<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Aug 3, 2020 at 2:51 PM Andy <<a href="mailto:borucki.andrzej@gmail.com">borucki.andrzej@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr">I see, Wikidata has also lexicographical data.</div><div>I think Wikidata lexemes are more computer readable that WIktionary lexemes. But also definitions of lexemes should be Abstract graphes?<br></div><div dir="ltr">At the moment only about 10 thousands lexemes. I don’t see translations lexemes to other languages. One sense can be translated to lexem in other language or sens of lexem in  other language/ For example I want add Polish “zamek” and give translate link from “lock” to “zamek” but not “zamek” as “castle” or “zip”. (Polish “zamek” = English: castle,lock,zip)<br>Lexicographical data are also in wikidata dump? (it will be well, if can download dump only lexicographical data + properties because dump of all Wikidata is huge)</div><div>Because number of WIkidata lexemes is relatively little, might be better new set of lexemes, all definitions would be graph-structured as other articles in Abstract WIkipedia and even definitions would have additional information, rules for automatic recognizing sense from context of unstructured text for many languages (but these rules is difficult problem). If we definie noun lexem "band" it can be music group or material belt, For WSD Is needed special rules for analysing context, because Lesk algorithm and its  modifications practically not works.</div><div>For example</div><div><div><span><span><span><span><span><span><span><span>Let consider sentence: "<span>Each band member wore a band."</span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>we must know, that:</span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>1. group of people have members</span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>2. material belt can be worn, not music group<br></span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span></span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>or / and<br></span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>1. are group of persons, active</span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>2. passive<br></span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>Is obvious for humans but<br></span></span></span></span></span></span></span></span></span></div><div><span><span><span><span><span><span><span><span><span>this</span></span></span></span></span></span></span></span></span><span dir="ltr"><span> is very not clear from the definition</span></span><span><span><span><span><span><span><span><span><span></span></span></span></span></span></span></span></span></span><span><span><span><span><span><span><span><span><span></span></span></span></span></span></span></span></span></span><span><span><span><span><span><span><span><span><span></span></span></span></span></span></span></span></span></span>s.</div></div><div>It is difficult problem, because if even we write rules as above, computer can't apply its to the sentence.</div><div>I don;t know, if rules are possible, anyway, it will be well if definitions will be also in structured graph form, whivh can be automatic translate to other languages.</div><div><br></div><div dir="ltr">Best regards,<br>Andrzej<br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">pon., 3 sie 2020 o 18:43 Grounder UK <<a href="mailto:grounderuk@gmail.com" target="_blank">grounderuk@gmail.com</a>> napisał(a):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">[1] <a href="https://www.wikidata.org/wiki/Wikidata:Lexicographical_data/Documentation" target="_blank">https://www.wikidata.org/wiki/Wikidata:Lexicographical_data/Documentation</a><div>[2] <a href="https://www.aclweb.org/anthology/2020.idl-1.12.pdf" target="_blank">https://www.aclweb.org/anthology/2020.idl-1.12.pdf</a></div><br>
</blockquote></div></div>
_______________________________________________<br>
Abstract-Wikipedia mailing list<br>
<a href="mailto:Abstract-Wikipedia@lists.wikimedia.org" target="_blank">Abstract-Wikipedia@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/abstract-wikipedia" rel="noreferrer" target="_blank">https://lists.wikimedia.org/mailman/listinfo/abstract-wikipedia</a><br>
</blockquote></div>