@হাসিব, ধন্যবাদ, আসলে প্রথম আলো ছাড়া প্রায় সব সংবাদপত্রে খবরটা থাকাতে আমার প্রথমে সন্দেহ হয়েছিল, এটা পেইড নিউজ কিনা। এখন বোঝাই যাচ্ছে আসল ঘটনা। সত্যিই কোনো ঠিকঠাক কাজ হলে তোমার কাছে খবরটা আসত আগে। যাই হোক দেখা যাক অনেক বাংলা ওসিআর ( Bengali OCR) প্রকল্পের মত এটাও শুধু খবর হয়ে থাকবে , নাকি বাস্তবের মুখ দেখবে, সেটা ভবিষ্যতই বলবে। তোমার রিপোর্টের অপেক্ষায় থাকবো।
@ মইনুল, তোমার কথার সপক্ষে অনেক কথাই বলতে হয়, কিছু কথা এখানে সেয়ার করা দরকার বলেই মনে করি, কারন কথাগুলো এখানে পাবলিকলি থাক সবাই দেখুক, বা জানুক বাংলা কম্পিউটিং এর বর্তমান কি অবস্থা, অবশ্যই বাংলা ওসিআর ( Bengali OCR) প্পরিপেক্ষিতেই কথাগুলি বলা। আমি ভুল হতে পারি তবে আমার জানা মতে বাংলা ওসিআর ( Bengali OCR) প্রথম ওপেন সোর্স প্রকল্পে কাজ শুরু করে অঙ্কুর গ্রুপ [2] [3]। বাংলা ওসিআর ( Bengali OCR) এর প্রয়োজনীয়তা আমরা সবাই অনুভব করছি ও করে চলেছি। বাংলা কম্পিউটিং এর ক্ষেত্রে এটা এক পরিচিত সমস্যা। এখনো পর্যন্ত বাংলা লিপির প্রামান্য ওসিআর নেই। এটা বাংলার জন্য দুর্ভাগ্যের। এমন কি ভারতীয় কোন ভাষায় ওসিআর নেই। জানি এটি অনেক গবেষণার ব্যাপার। তবে কিছু কিছু জায়গায় ওসিআর তৈরির কাজ হয়েছে ও হচ্ছে। প্রামান্য ওসিআর কবে পাওয়া যাবে সেই ব্যাপারে আমার কিছু বলার নেই, তবে ইংরেজি লিপি নিয়ে অনেক গবেষণা হয়েছে বলেই ওসিআর তৈরির কাজটা সহজ হয়েছিল, বাংলার ক্ষেত্রে তেমন কোনো গবেষণা হচ্ছে বলে আমার জানা নেই। বাঙালি বা বাংলার বিশ্ববিদ্যালয় এই ব্যপারে এগিয়ে আসলেই তবে সম্ভব হবে। বাংলার বিশ্ববিদ্যালয় গুলি বা আপামর বাঙ্গালী জাতি নিজের ভাষা বা লিপি সম্পর্কে খুবই উদাসিন। বাংলা লিপির উপর কয়জন পিএইচ ডি করে আমার জানা নেই। আর এখন তো কপি পেস্টের যুগ, ছাত্ররা থিসিস লেখে উইকিপিডিয়া থেকে কপি পেস্ট করে। এতো বছরেও বাঙ্গালিরা একটা বাংলা ওসিআর সফটওয়্যার *তৈরি* করতে পারলো না। এটা খুব বেদনার।
অঙ্কুর গ্রুপের বাংলা ওসিআর ( Bengali OCR) প্রকল্পের কি অবস্থা আজ ও আমার জানা নেই। অঙ্কুর মুক্ত সফটওয়্যার গ্রুপের কেউই এই বিষয়ে মেইলের উত্তর দেয় না। [4] ব্যাবহার করে দেখার মত কোনো EXE বা BIN কিছুই নেই বা পাওয়া যায় না। কোথায় আছে কেউ সন্ধান দেয় না।
ভারতেও সরকারি ভাবে কি হচ্ছে তাদের অয়েব সাইট থেকে জানা যায়, কিন্তু কোনও অশ্বডিম্ব পাওয়া যায়নি। যেমন সিড্যাক [1] বা ভাষা প্রযুক্তি গবেষণা পরিষদ [1]। আর সাথে রয়েছে ভারতের দুর্নীতি, বাংলা ওসিআর ( Bengali OCR) তৈরি করবে বলে টাকা নিয়ে Indian Statistical Institute এর কোনো এক অধিককর্তা নাকি কেন্দ্রীয় সরকারের কোটি কোটি টাকা মেরে দিয়েছে, কিন্তু বাংলা ওসিআর ( Bengali OCR) পাওয়া যায় নি। [7]
যাই হোক ২০০৯ সালের শেষ দিকে বাংলাদেশের ব্রাক ইউনিভার্সিটির একটা প্রোজেক্ট সেন্টার ফর রিসার্চ অন বাংলা লেংগুয়েজ প্রসেসিং (সিআরবিএলপি ) থেকে একটি বাংলা ওসিআর ( Bengali OCR) তৈরি করেছিল। [5] এটা ওপেন সোর্স গুগুল কোডে [6] রাখা আছে, যা আমিও ব্যবহার করি , তুমিও দেখতে পারো। যেটার কথাই তুমি বলছিলে। এটাকে আমি বাংলা উইকিসংকলনেও পরীক্ষামুলক ভাবে ইন্সস্টল করেছি। ঐ প্রকল্পের মূল ডেভপলারের সঙ্গেও আমি নিয়মিত যোগাযোগ রেখে চলেছি। কিন্তু, শেষ মেইল অনুসারে মূল ডেভপলার হাসনাত নিজের ব্যাক্তিগত কাজের চাপের জন্য এই কাজটা এগিয়ে নিয়ে যেতে পারছে না। এখন ও পর্যন্ত আমার জানামতে এটাই এখন মোটামুটি প্রামান্য বাংলা ওসিআর ( Bengali OCR) যা প্রায় ৩০০ ডিপিয়াই ভাল স্ক্যানের ক্ষেত্রে ৭০% কাজ করে।
https://en.wikipedia.org/wiki/Template:OCR1)http://ocr.cdacnoida.in/, http://www.cdac.in/html/press/archives/atjp02/prs_rl114.aspx, 2)https://en.wikipedia.org/wiki/Ankur_Group 3) http://www.ankur.org.bd/wiki/Home 4) http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/2014-February... 5) http://www.panl10n.net/center-for-research-on-bangla-language-processing-crb... 6)https://code.google.com/p/banglaocr/ 7)http://ddts.randomink.org/blog/?p=17 8)http://crblpocr.blogspot.in/
2014-05-19 10:46 GMT+05:30 Mayeenul Islam wz.islam@gmail.com:
এরও বহু বছর আগে একুশে টেলিভিশনের সর্বময় বাংলা ঘরাণার একটি প্রতিবেদনে বাংলার উপর অনেকগুলো কাজের একটা হিসেবে ব্র্যাক বিশ্ববিদ্যালয়ের ছাত্রদের করা একটা ওসিআর-এর কাজের ব্যাপারে জানি। কিন্তু ওটারও আর কোনো আপডেট পাইনি। [?] অপেক্ষায় আছি...
*Mayeenul Islam* *Front-end Designer & WordPress Developer* [image: http://nanodesignsbd.com/] http://nanodesignsbd.com/ email: wz.islam@gmail.com blog: nishachor.com *Bangla Wikipedia* Editorhttp://bn.wikipedia.org/wiki/ব্যবহারকারী:Mayeenul_Islam| Founding member of Wikimedia Bangladeshhttp://bd.wikimedia.org/wiki/নির্বাহী_পরিষদ
2014-05-19 11:03 GMT+06:00 Nurunnaby Chowdhury nh@nhasive.com:
জয়ন্ত দা, এটার আর কোন আপডেট নেই। উদ্যোক্তারা এখনও পুরোপুরি চালুর তারিখও জানাতে পারেননি। তবে কাজ চলছে। কাজ চলা অবস্থায়ই নিউজ হয়ে গেছে!
2014-05-19 0:17 GMT+06:00 Jayanta Nath jayantanth@gmail.com:
প্রিয় সবাই,
কয়েকদিন আগে বাংলাদেশের অনেক সংবাদ মাধ্যমে বাংলা ওসিআর সংক্রান্ত একটি খবর প্রকাশিত হয়েছিল, এই খবরের শেষ কোনো আপডেট কেউ দিতে পারেন?
http://www.dbarta.com/?p=13646 http://www.dhakatimes24.com/2014/03/12/17661 http://www.kalerkantho.com/feature/techbishaw/2014/04/02/68179 http://www.ittefaq.com.bd/index.php?ref=MjBfMDVfMThfMTNfMV8xOF8xXzQxNDky http://www.alokitobangladesh.com/development-possibility/2014/04/02/63386 http://tm-engine.com/project-research.php
জয়ন্ত
Wikipedia-BN mailing list Wikipedia-BN@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipedia-bn
-- *Nurunnaby Chowdhury Hasive* Administrator | Bengali Wikipediahttp://bn.wikipedia.org/wiki/user:nhasive Member | IEG Committee, Wikimedia Foundationhttps://meta.wikimedia.org/wiki/Grants:IdeaLab/People Social Media Interaction Expert | The Daily Prothom-Alohttp://www.prothom-alo.com Bangladesh Ambassador | Open Knowledge Foundation Network http://www.okfn.org Treasurer | Bangladesh Open Source Network (BdOSN) http://www.bdosn.org Task Force Member | Mozilla Bangladesh http://www.mozillabd.org fb.com/nhasive | @nhasive http://www.twitter.com/nhasive | Skype: nhasive | www.nhasive.com
Wikimedia-BD mailing list Wikimedia-BD@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd
Wikimedia-BD mailing list Wikimedia-BD@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd