Alex Brollo ha scritto:
Nel web si trovano versioni virtuali (pubblicate come
immagini delle pagine)
di testi antichi, io ne ho trovati alcuni riguardanti la storia
dell'equitazione (Corte, Grisone, Pluvinel e altri).
Vi chiedo: c'è qualche OCR free per estrarre il testo da pagine così
antiche (1500-1600-1700) , con caratteri piuttosto bizzarri? Qualcuno ha
esperienza analoghe?
L'unico OCR efficiente in questi casi è il cervello umano, e, proprio
per questo, ti cito la Carnegie Mellon University che si è inventata un
captcha che si basa su testi antichi cogliendo 2 piccioni con una fava..
1) abbattono lo spam robotizzato
2) sfruttando il riconoscimento degli utenti, digitalizzano i testi
usati per i captcha..
secondo me sono geniali:
http://www.makeyougohmm.com/20070524/4523/
http://recaptcha.net/
--
Edoardo Marascalchi
ICT Consultant
website:
http://www.edoardomarascalchi.it
skype: My status <skype:asca_edom?call>