<div dir="ltr">Thanks Jeremy, as you imagine it's a typical wikisource idea.<div><br></div><div>Here: <a href="http://www.opal.unito.it/">http://www.opal.unito.it/</a> there's a large collection of free scans from ancient Italian books published as double-page pdf. The idea is to uploade them into Internet Archive, but presently IA OCR doesn't self-split pages; I can't upload pdfs as they are; so I'm testing routines to extract tiff/jpg images from pdf, to split them (by python PIL)  and  to wrap them into zip files, so that they can be uploaded into IA.</div>
<div><br></div><div>As soon as IA derives the files, both wikisource and the whole web can find "a done job", and can use resulting serchable pdf file or djvu or any other derived file.</div><div><br></div><div>
OPAL shares thousands of rare book, so any help by automated routines makes the difference.</div><div><br></div><div>This is a big (perhaps, too big) challenge for my present limited skills, but I found that I learn only from similar "missions impossible" :-)</div>
<div><br></div><div>Alex</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2014-02-05 Jeremy Baron <span dir="ltr"><<a href="mailto:jeremy@tuxmachine.com" target="_blank">jeremy@tuxmachine.com</a>></span>:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr"></p><div class="im">On Feb 5, 2014 3:11 AM, "Alex Brollo" <<a href="mailto:alex.brollo@gmail.com" target="_blank">alex.brollo@gmail.com</a>> wrote:<br>
</div><div class="im">
> Just to avoid "rediscovering the wheel", is someone doing something similar into Labs? </div><p></p>
<p dir="ltr">I'm unsure what your goal/purpose is but <a href="https://wikimania2012.wikimedia.org/wiki/Submissions/Open_Access_Media_Importer" target="_blank">https://wikimania2012.wikimedia.org/wiki/Submissions/Open_Access_Media_Importer</a> seems relevant. (git repo linked from there)</p>
<span class="HOEnZb"><font color="#888888">

<p dir="ltr">-Jeremy</p>
</font></span><br>_______________________________________________<br>
Labs-l mailing list<br>
<a href="mailto:Labs-l@lists.wikimedia.org">Labs-l@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/labs-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/labs-l</a><br>
<br></blockquote></div><br></div>