<span style="font-family: garamond,serif;"></span><font style="font-family: verdana,sans-serif;" size="2">I have a query. <br><br>What is the license of </font><font style="font-family: verdana,sans-serif;" face="Tahoma" size="2"><span>Tamil Kalaikalanjiam? Did Tamil Nadu government or </span></font><font style="font-family: verdana,sans-serif;" face="Tahoma" size="2"><span>Tamil Virtual University had officially announced that this Encyclopedia is </span></font><font style="font-family: verdana,sans-serif;" size="2">released
 in Public Domain or in some creative commons license so that we can 
reuse the content. If yes, we can very well reuse the content. Otherwise
 it will be copyright violation. So kindly verify this. <br><br>Let us not 
assume that since it is published by Government it will be in pubic 
domain. In India that is not the case.<br><br>In 2008 December, Kerala 
Government has officially announced that it is changing  the license of 
similar encyclopedic project in Malayalam  (sarvavijanakosam) to <a href="http://www.gnu.org/copyleft/fdl.html">Free documentation license</a>
 so that Malayalam wiki community can reuse its content to develop 
Malayalam wikipedia. Governmant has officially announced it. Kerala Government has also set up its own wiki (to help 
us) for <a href="http://en.wikipedia.org/wiki/Sarvavijnanakosam">Sarvavijanakosam</a> and they are slowly digitizing the content and posting in its own 
wiki (<a href="http://mal.sarva.gov.in">http://mal.sarva.gov.in</a>). They have completed some 2,900 articles now. We are 
reusing this content to enhance many of the existing articles. But we 
are not copy pasting  the entire content due to various reasons. The main 
reason is, the content need to rewritten as per the style of wikipedia.<br><br>I really have doubt about the
 efficiency of  current OCR softwares for Indian languages. It is still 
under development. The existing solutions are not good. </font>I am not sure about Tamil OCR softwares.<br style="font-family: times new roman,serif;">
<br>Shiju Alex<br><br><div class="gmail_quote">On Mon, Nov 15, 2010 at 11:33 AM, Murali Kumar <span dir="ltr">&lt;<a href="mailto:pthooran@hotmail.com" target="_blank">pthooran@hotmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">



<div>
<div><font face="Tahoma" size="4"><span style="font-size: 16px;">Dear Wikimedia India,</span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">As you probably aware the Govt. of India, immediately post Independence started multiple Indian language encyclopedia projects to stream in Science and Technology. The Tamil language encyclopedia was completed [<a href="http://en.wikipedia.org/wiki/Tamil_Encyclopedia" target="_blank">http://en.wikipedia.org/wiki/Tamil_Encyclopedia</a>]    </span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">I&#39;m pleased to report Tamil Virtual University has scanned in the Tamil Kalaikalanjiam / Tamil Encyclopedia [Please see Reference 1 below].</span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">I was able to download the material via the wonderful wget command and the &#39;convert&#39; (from imagemagick lib)  in GNU/Linux. However each of the 10 volumes is close to 700 MB without compression.</span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">I would imagine, the people behind this mammoth task (pre-internet era) would have liked it to be merged into a Wiki type format, which would make it a truly living document </span></font><font face="Tahoma">in-sync</font><font face="Tahoma" size="4"><span style="font-size: 16px;"> with the times.</span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">I do not have any experience with 1) Tamil OCR software and 2) Automated updates to Wikipedia. </span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;">  </span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">Can anyone take the lead on this project ? It will help boost the number of quality, articles in Indian languages. The Children&#39;s encyclopedia is being scanned and has a lot of great visual content.</span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">I have uploaded a sample (10 MB) PDF file at <a href="https://sites.google.com/site/periasamythooran/kalaikalanjiam/kalaikalanjiamWikiMergeAttempt.pdf" target="_blank">https://sites.google.com/site/periasamythooran/kalaikalanjiam/kalaikalanjiamWikiMergeAttempt.pdf</a> if you are interested to give it a spin.</span></font></div>

<div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">Thanks,</span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br>

</span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">Murali.</span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;"><br></span></font></div><div><font face="Tahoma" size="4"><span style="font-size: 16px;">1. <a href="http://www.tamilvu.org/library/libindex.htm" target="_blank">http://www.tamilvu.org/library/libindex.htm</a> and click on Kalaikalanjiam / Tamil Encyclopedia.</span></font></div>

                                               </div>
<br>_______________________________________________<br>
Wikimediaindia-l mailing list<br>
<a href="mailto:Wikimediaindia-l@lists.wikimedia.org" target="_blank">Wikimediaindia-l@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/wikimediaindia-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediaindia-l</a><br>
<br></blockquote></div><br>