2011/2/13 Daniel Koć kocio@linuxnews.pl:
Pewnych rzeczy nie przeskoczymy - pozostaną kwestie np. uźródławiania czy stopniowego odchodzenia od swobodnego tekstu bardziej w kierunku danych semantycznych i to faktycznie wymaga szczególnych predyspozycji do dłubania.
Co to są „dane semantyczne”? W Wikipedii nie znalazłam takiego hasła :) a skoro to potrzebne do edytowania, to chyba dobrze byłoby wiedzieć?
Beata
W dniu 26.02.2011 22:39, Beata Ciepal pisze:
Co to są „dane semantyczne”? W Wikipedii nie znalazłam takiego hasła :) a skoro to potrzebne do edytowania, to chyba dobrze byłoby wiedzieć?
Przepraszam że się nieprecyzyjnie wyraziłem.
Chodziło mi o dane mocno ustrukturalizowane, tak, że mogą być interpretowane bardziej automatycznie. Dobrym przykładem są choćby infoboksy (konkretne pola mają jakieś wartości) albo kategorie (da się ustalić, że hasło w podkategorii "Warszawa" zarazem należy do kategorii "Polska").
W dniu 27 lutego 2011 00:32 użytkownik Daniel Koć kocio@linuxnews.pl napisał:
W dniu 26.02.2011 22:39, Beata Ciepal pisze:
Co to są „dane semantyczne”? W Wikipedii nie znalazłam takiego hasła :) a skoro to potrzebne do edytowania, to chyba dobrze byłoby wiedzieć?
Przepraszam że się nieprecyzyjnie wyraziłem.
Chodziło mi o dane mocno ustrukturalizowane, tak, że mogą być interpretowane bardziej automatycznie. Dobrym przykładem są choćby infoboksy (konkretne pola mają jakieś wartości) albo kategorie (da się ustalić, że hasło w podkategorii "Warszawa" zarazem należy do kategorii "Polska").
Myślę, że i tak mało kto to zrozumiał ;-)
Chodzi o to, że dla maszyny zapis infoboksu w haśle Polska brzmi mnie więcej w stylu "stolicą Polski jest Warszawa" i gdybyśmy na podstawie tego chcieli zapytać maszynę "którego kraju stolicą jest Warszawa?", to maszyna będzie w stanie odpowiedzieć na to pytanie.
Z danych Wikipedii czerpią takie projekty jak DBpedia i Freebase. A największą kopalnią danych semantycznych jest Niemiecka Wikipedia.
Semantic Web to jeden z filarów postulowanego Web 3.0.
-- Leinad
W dniu 27 lutego 2011 00:57 użytkownik Daniel ~ Leinad danny.leinad@gmail.com napisał:
W dniu 27 lutego 2011 00:32 użytkownik Daniel Koć kocio@linuxnews.pl napisał:
W dniu 26.02.2011 22:39, Beata Ciepal pisze:
Co to są "dane semantyczne"? W Wikipedii nie znalazłam takiego hasła :) a skoro to potrzebne do edytowania, to chyba dobrze byłoby wiedzieć?
Przepraszam że się nieprecyzyjnie wyraziłem.
Chodziło mi o dane mocno ustrukturalizowane, tak, że mogą być interpretowane bardziej automatycznie. Dobrym przykładem są choćby infoboksy (konkretne pola mają jakieś wartości) albo kategorie (da się ustalić, że hasło w podkategorii "Warszawa" zarazem należy do kategorii "Polska").
Myślę, że i tak mało kto to zrozumiał ;-)
Chodzi o to, że dla maszyny zapis infoboksu w haśle Polska brzmi mnie więcej w stylu "stolicą Polski jest Warszawa" i gdybyśmy na podstawie tego chcieli zapytać maszynę "którego kraju stolicą jest Warszawa?", to maszyna będzie w stanie odpowiedzieć na to pytanie.
Z danych Wikipedii czerpią takie projekty jak DBpedia i Freebase. A największą kopalnią danych semantycznych jest Niemiecka Wikipedia.
Semantic Web to jeden z filarów postulowanego Web 3.0.
W tym sensie - to w zasadzie jedyne dane tego typu, które wpisuje user, to kategoria i interwiki. Reszta wynika z naturalnej konstrukcji artykułów. Żadne inne "dane sematyczne" nie są na edytorach wymuszane. W dodatku podanie tych "danych semantycznych" można by wymusić za pomocą np: prostego formularza, tak jak to jest Wikimedia Commons czy OmegaWiki. IMHO problem z trudnością w edytowaniu wynika raczej ze złożoności kodu, wynikającego z nawarstwienia kolejnych, pierwotnie mających ułatwiać edytowanie "udogodnień", takich jak infoboxy, szablony nawigacyjne i przypisy. Wyjątkowo "dziwne" i kłopotliwe jest też tworzenie tabel i wpisywanie wzorów matematycznych.
Tomasz Ganicz polimerek@gmail.com wrote:
W tym sensie - to w zasadzie jedyne dane tego typu, które wpisuje user, to kategoria i interwiki. Reszta wynika z naturalnej konstrukcji artykułów. Żadne inne "dane sematyczne" nie są na edytorach wymuszane. W dodatku podanie tych "danych semantycznych" można by wymusić za pomocą np: prostego formularza, tak jak to jest Wikimedia Commons czy OmegaWiki.
Poza tym wcale nie jest powiedziane, że oddzielne podawanie "danych semantycznych" to jest w ogóle właściwa metoda. Oddzielne dane opisujące przedmiot artykułu są zazwyczaj zdezaktualizowane lub zbytnio upraszczają rzeczywistość, którą artykuł opisuje. Często widać tą chorobę na przykładzie "infoboksów" (tabelek opisujących w skrócie przedmiot artykułu, umieszczanych zazwyczaj po prawej stronie). Informatyka idzie do przodu i komputery uczą się wyciągać informacje z tekstu, tak więc być może powoli tworzenie oddzielnych opisów "aby komputer zrozumiał" nie będzie konieczne.
//Marcin
Poza tym wcale nie jest powiedziane, że oddzielne podawanie "danych semantycznych" to jest w ogóle właściwa metoda. Oddzielne dane opisujące przedmiot artykułu są zazwyczaj zdezaktualizowane lub zbytnio upraszczają rzeczywistość, którą artykuł opisuje. Często widać tą chorobę na przykładzie "infoboksów" (tabelek opisujących w skrócie przedmiot artykułu, umieszczanych zazwyczaj po prawej stronie).
Ba. Zdezaktualizowane dane - minęły 3 miesiące od wyborów samorządowych, a wójtowie w "Gmina infobox" nie zostali do końca zaktualizowani. To samo dotyczy powierzchni i ludności gmin - są przecież oficjalne dane (GUS a. PKW), liczby w artykułach powinny być aktualizowane z automatu, z wyłączeniem możliwości dodania 1 mieszkańca, "bo właśnie urodził mi się siostrzeniec".
Picus viridis
Ba. Zdezaktualizowane dane - minęły 3 miesiące od wyborów samorządowych, a wójtowie w "Gmina infobox" nie zostali do końca zaktualizowani. To samo dotyczy powierzchni i ludności gmin - są przecież oficjalne dane (GUS a. PKW), liczby w artykułach powinny być aktualizowane z automatu, z wyłączeniem możliwości dodania 1 mieszkańca, "bo właśnie urodził mi się siostrzeniec".
Gdyby to był Facebook, po prostu kliknąłbym pod wypowiedzią Picusa ikonkę "lubię to". A tak musiałem pisać specjalnie tę wiadomość :)
Powerek38
Ale tych wójtów to ktoś mógłby wybotować, a i liczbę mieszkańców też by się dało pewnie (z refem nawet :P). Chętni?
W dniu 27 lutego 2011 20:01 użytkownik Powerek38 powerek38@gazeta.pl napisał:
Ba. Zdezaktualizowane dane - minęły 3 miesiące od wyborów samorządowych, a wójtowie w "Gmina infobox" nie zostali do końca zaktualizowani. To samo dotyczy powierzchni i ludności gmin - są przecież oficjalne dane (GUS a. PKW), liczby w artykułach powinny być aktualizowane z automatu, z wyłączeniem możliwości dodania 1 mieszkańca, "bo właśnie urodził mi się siostrzeniec".
Gdyby to był Facebook, po prostu kliknąłbym pod wypowiedzią Picusa ikonkę "lubię to". A tak musiałem pisać specjalnie tę wiadomość :)
Powerek38
WikiPL-l mailing list WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
Ale tych wójtów to ktoś mógłby wybotować, a i liczbę mieszkańców też by się dało pewnie (z refem nawet :P).
4 lata temu to chyba tsca wziął ode mnie wsad, a Sicherlich do dewiki (jeśli idzie o wyniki wyborów). Co prawda zmieniło się ok. 400 wójtów, więc dałoby się zrobić ręcznie...
Picus viridis
W dniu 27 lutego 2011 23:00 użytkownik Tomek elfhelm@gazeta.pl napisał:
Ale tych wójtów to ktoś mógłby wybotować, a i liczbę mieszkańców też by się dało pewnie (z refem nawet :P). Chętni?
Ja pisałem o tym wielokrotnie, ale warunkiem była dobra baza danych, gdzie będzie powierzchnia, gęstość i ludność w danym roku. Wiem że jedną z tych wartości łatwo można obliczyć mają dwie pozostałe, ale powierzchni i gęstości nie znalazłem dla wszystkich miejscowości, więc nie mogę bota odpalić.
Karol007