http://www.trojmiasto.pl/wiadomosci/Cale-morze-darmowych-publikacji-w-Intern...
Materiał dla Wikiźródeł?
Wojtek
Dnia 02-07-2010 o 19:10:25 Wojciech Pędzich napisał:
http://www.trojmiasto.pl/wiadomosci/Cale-morze-darmowych-publikacji-w-Intern...
Materiał dla Wikiźródeł?
Wojtek
Akurat na brak materiałów nie narzekamy :) Polskie biblioteki cyfrowe udostępniają masę ciekawych pozycji do opracowania, niestety – brakuje nam ludzi.
<reklama> Gdyby ktoś z szanownych wikipedystów chciał troszkę odpocząć od Wikipedii, nie tracąc jednocześnie kontaktu z wikiświatkiem, to czekamy z otwartymi ramionami. Szczególnie że korygowanie tekstów w proofread nie jest wymagającym zajęciem, a przy okazji można poczytać wiele ciekawych lektur sprzed II wojny światowej i starszych. Z racji wielkości projektu, panuje też spokojna atmosfera – wikiwakacje tylko z Wikiźródłami! </reklama>
W dniu 2010-07-02 19:41, EMeczKa pisze:
Dnia 02-07-2010 o 19:10:25 Wojciech Pędzich napisał:
http://www.trojmiasto.pl/wiadomosci/Cale-morze-darmowych-publikacji-w-Intern...
Materiał dla Wikiźródeł?
Wojtek
Akurat na brak materiałów nie narzekamy :) Polskie biblioteki cyfrowe udostępniają masę ciekawych pozycji do opracowania, niestety – brakuje nam ludzi.
<reklama> Gdyby ktoś z szanownych wikipedystów chciał troszkę odpocząć od Wikipedii, nie tracąc jednocześnie kontaktu z wikiświatkiem, to czekamy z otwartymi ramionami. Szczególnie że korygowanie tekstów w proofread nie jest wymagającym zajęciem, a przy okazji można poczytać wiele ciekawych lektur sprzed II wojny światowej i starszych. Z racji wielkości projektu, panuje też spokojna atmosfera – wikiwakacje tylko z Wikiźródłami! </reklama>
Szczerze rzekłszy oczekiwałem takiego odzewu. Nie zapominajmy o młodszym rodzeństwie :)
Idę coś poczytać.
W.
W dniu 2 lipca 2010 19:10 użytkownik Wojciech Pędzich wpedzich@wp.pl napisał:
http://www.trojmiasto.pl/wiadomosci/Cale-morze-darmowych-publikacji-w-Intern...
Materiał dla Wikiźródeł?
Część na pewno można wrzucić na Commons. Pocztówki i mapy zawsze są mile widziane.
Yarl
http://www.trojmiasto.pl/wiadomosci/Cale-morze-darmowych-publikacji-w-Intern...
Materiał dla Wikiźródeł?
Część na pewno można wrzucić na Commons. Pocztówki i mapy zawsze są mile widziane.
Z całą pewnością wrzucisz publikacje Lecha Bądkowskiego i skany czasopisma "Morze" [jedne i drugie czytałem 30 lat temu "na żywo"] :P Poza tym wywiadowana bibliotekarka mówiąc "kanon literatury w wielu placówkach się dubluje" lekko mija się z rzeczywistością, bo w PBI mamy niezczytane OCR-y. a w "Polonie" skany pojedynczych stron. Ba przykład "Cyrano de Bergerac" - zob. http://www.pbi.edu.pl/book_reader.php?p=54766&s=1 - zeskanowali i zOCRowali identyfikatory arkuszy drukarskich (czy jak to się nazywa, ta metka na początku zszywki).
Picus viridis
Dnia 02-07-2010 o 23:56:24 picus-viridis napisał:
Poza tym wywiadowana bibliotekarka mówiąc "kanon literatury w wielu placówkach się dubluje" lekko mija się z rzeczywistością, bo w PBI mamy niezczytane OCR-y. a w "Polonie" skany pojedynczych stron. Ba przykład "Cyrano de Bergerac" - zob. http://www.pbi.edu.pl/book_reader.php?p=54766&s=1 - zeskanowali i zOCRowali identyfikatory arkuszy drukarskich (czy jak to się nazywa, ta metka na początku zszywki).
Picus viridis
Tu [ http://fbc.pionier.net.pl/owoc/duplicates-matrix-report ] jest garść statystyk na ten temat. Osobiście nie mam nic przeciwko duplikatom, gdyż w książkach w poszczególnych bibliotekach cyfrowych często brakuje po kilka stron, a niezależnie skanowana publikacja daje szansę na złożenie danej książki w całość.
O jakości OCR-ów w PBI lepiej się nie wypowiadać… Niestety, wyraźnie widać brak ręcznej weryfikacji albo – w najlepszym wypadku – bardzo pobieżne przeglądnięcie otrzymanego poprzez OCR tekstu.
PS Jakiś kącik biblioteczny nam się zrobił :)