@হাসিব, ধন্যবাদ, আসলে প্রথম আলো ছাড়া প্রায় সব সংবাদপত্রে খবরটা থাকাতে আমার প্রথমে সন্দেহ হয়েছিল, এটা পেইড নিউজ কিনা। এখন বোঝাই যাচ্ছে আসল ঘটনা। সত্যিই কোনো ঠিকঠাক কাজ হলে তোমার কাছে খবরটা আসত আগে। যাই হোক দেখা যাক অনেক বাংলা ওসিআর ( Bengali OCR) প্রকল্পের মত এটাও শুধু খবর হয়ে থাকবে , নাকি বাস্তবের মুখ দেখবে, সেটা ভবিষ্যতই  বলবে। তোমার রিপোর্টের অপেক্ষায় থাকবো।

@ মইনুল, তোমার কথার সপক্ষে অনেক কথাই বলতে হয়, কিছু কথা এখানে সেয়ার করা দরকার বলেই মনে করি, কারন কথাগুলো এখানে পাবলিকলি থাক সবাই দেখুক, বা জানুক বাংলা কম্পিউটিং এর বর্তমান কি অবস্থা, অবশ্যই  বাংলা ওসিআর ( Bengali OCR) প্পরিপেক্ষিতেই কথাগুলি বলা।  আমি ভুল হতে পারি তবে আমার জানা মতে বাংলা ওসিআর ( Bengali OCR)  প্রথম ওপেন সোর্স প্রকল্পে কাজ শুরু করে অঙ্কুর  গ্রুপ [2] [3]।  বাংলা ওসিআর ( Bengali OCR) এর প্রয়োজনীয়তা  আমরা সবাই অনুভব করছি ও করে চলেছি। বাংলা কম্পিউটিং এর ক্ষেত্রে এটা এক পরিচিত সমস্যা। এখনো পর্যন্ত বাংলা লিপির প্রামান্য ওসিআর নেই। এটা বাংলার জন্য দুর্ভাগ্যের। এমন কি ভারতীয় কোন ভাষায় ওসিআর নেই। জানি এটি অনেক গবেষণার ব্যাপার। তবে কিছু কিছু জায়গায় ওসিআর তৈরির কাজ হয়েছে ও হচ্ছে। প্রামান্য ওসিআর কবে পাওয়া যাবে সেই ব্যাপারে আমার কিছু বলার নেই, তবে ইংরেজি লিপি নিয়ে অনেক গবেষণা হয়েছে বলেই ওসিআর তৈরির কাজটা সহজ হয়েছিল, বাংলার ক্ষেত্রে তেমন কোনো গবেষণা হচ্ছে বলে আমার জানা নেই। বাঙালি বা বাংলার বিশ্ববিদ্যালয় এই ব্যপারে এগিয়ে আসলেই তবে সম্ভব হবে। বাংলার বিশ্ববিদ্যালয় গুলি  বা আপামর বাঙ্গালী জাতি নিজের ভাষা বা লিপি সম্পর্কে খুবই উদাসিন। বাংলা লিপির উপর কয়জন পিএইচ ডি করে আমার জানা নেই। আর এখন তো কপি পেস্টের যুগ, ছাত্ররা থিসিস লেখে উইকিপিডিয়া থেকে কপি পেস্ট করে। এতো বছরেও বাঙ্গালিরা একটা  বাংলা ওসিআর  সফটওয়্যার তৈরি করতে পারলো না। এটা খুব বেদনার।

অঙ্কুর  গ্রুপের  বাংলা ওসিআর ( Bengali OCR) প্রকল্পের  কি অবস্থা  আজ ও আমার জানা নেই। অঙ্কুর  মুক্ত  সফটওয়্যার গ্রুপের কেউই  এই বিষয়ে মেইলের উত্তর দেয় না। [4]  ব্যাবহার করে দেখার মত কোনো EXE বা BIN কিছুই নেই বা পাওয়া যায় না। কোথায় আছে কেউ সন্ধান দেয় না।

ভারতেও সরকারি ভাবে কি হচ্ছে  তাদের অয়েব সাইট থেকে জানা যায়, কিন্তু কোনও অশ্বডিম্ব পাওয়া যায়নি।  যেমন সিড্যাক [1] বা ভাষা প্রযুক্তি গবেষণা পরিষদ [1]। আর সাথে রয়েছে ভারতের দুর্নীতি,  বাংলা ওসিআর ( Bengali OCR) তৈরি করবে বলে টাকা নিয়ে  Indian Statistical Institute এর কোনো এক অধিককর্তা নাকি  কেন্দ্রীয় সরকারের কোটি কোটি টাকা মেরে দিয়েছে, কিন্তু  বাংলা ওসিআর ( Bengali OCR) পাওয়া যায় নি। [7]

যাই হোক ২০০৯ সালের শেষ দিকে  বাংলাদেশের ব্রাক ইউনিভার্সিটির একটা প্রোজেক্ট  সেন্টার ফর রিসার্চ অন বাংলা লেংগুয়েজ প্রসেসিং (সিআরবিএলপি ) থেকে একটি  বাংলা ওসিআর ( Bengali OCR) তৈরি করেছিল। [5] এটা ওপেন সোর্স গুগুল কোডে  [6]  রাখা আছে, যা  আমিও ব্যবহার করি , তুমিও দেখতে পারো। যেটার কথাই তুমি বলছিলে। এটাকে আমি বাংলা উইকিসংকলনেও পরীক্ষামুলক ভাবে ইন্সস্টল করেছি। ঐ প্রকল্পের মূল ডেভপলারের সঙ্গেও আমি নিয়মিত যোগাযোগ রেখে চলেছি। কিন্তু, শেষ মেইল অনুসারে মূল ডেভপলার  হাসনাত  নিজের ব্যাক্তিগত কাজের চাপের জন্য এই কাজটা এগিয়ে নিয়ে যেতে পারছে না। এখন ও পর্যন্ত আমার জানামতে এটাই এখন মোটামুটি প্রামান্য বাংলা ওসিআর ( Bengali OCR) যা প্রায় ৩০০ ডিপিয়াই  ভাল স্ক্যানের ক্ষেত্রে ৭০% কাজ করে।


1)http://ocr.cdacnoida.in/, http://www.cdac.in/html/press/archives/atjp02/prs_rl114.aspx,
2)https://en.wikipedia.org/wiki/Ankur_Group
3) http://www.ankur.org.bd/wiki/Home
4)http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/2014-February/000424.html
5) http://www.panl10n.net/center-for-research-on-bangla-language-processing-crblp-bangladesh/
6)https://code.google.com/p/banglaocr/
7)http://ddts.randomink.org/blog/?p=17
8)http://crblpocr.blogspot.in/



2014-05-19 10:46 GMT+05:30 Mayeenul Islam <wz.islam@gmail.com>:
এরও বহু বছর আগে একুশে টেলিভিশনের সর্বময় বাংলা ঘরাণার একটি প্রতিবেদনে বাংলার উপর অনেকগুলো কাজের একটা হিসেবে ব্র্যাক বিশ্ববিদ্যালয়ের ছাত্রদের করা একটা ওসিআর-এর কাজের ব্যাপারে জানি। কিন্তু ওটারও আর কোনো আপডেট পাইনি।
অপেক্ষায় আছি...

Mayeenul Islam
Front-end Designer & WordPress Developer

http://nanodesignsbd.com/
email: wz.islam@gmail.com
blog: nishachor.com
Bangla Wikipedia Editor| Founding member of Wikimedia Bangladesh



2014-05-19 11:03 GMT+06:00 Nurunnaby Chowdhury <nh@nhasive.com>:
জয়ন্ত দা,
এটার আর কোন আপডেট নেই। উদ্যোক্তারা এখনও পুরোপুরি চালুর তারিখও জানাতে পারেননি। তবে কাজ চলছে। কাজ চলা অবস্থায়ই নিউজ হয়ে গেছে!


2014-05-19 0:17 GMT+06:00 Jayanta Nath <jayantanth@gmail.com>:
প্রিয় সবাই,

কয়েকদিন আগে বাংলাদেশের অনেক সংবাদ মাধ্যমে বাংলা ওসিআর সংক্রান্ত একটি খবর প্রকাশিত হয়েছিল, এই খবরের শেষ কোনো আপডেট কেউ দিতে পারেন?

http://www.dbarta.com/?p=13646
http://www.dhakatimes24.com/2014/03/12/17661
http://www.kalerkantho.com/feature/techbishaw/2014/04/02/68179
http://www.ittefaq.com.bd/index.php?ref=MjBfMDVfMThfMTNfMV8xOF8xXzQxNDky
http://www.alokitobangladesh.com/development-possibility/2014/04/02/63386
http://tm-engine.com/project-research.php

জয়ন্ত

_______________________________________________
Wikipedia-BN mailing list
Wikipedia-BN@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikipedia-bn




--
Nurunnaby Chowdhury Hasive
Administrator | Bengali Wikipedia
Member | IEG Committee, Wikimedia Foundation
Social Media Interaction Expert | The Daily Prothom-Alo
Bangladesh Ambassador | Open Knowledge Foundation Network
Treasurer | Bangladesh Open Source Network (BdOSN)
Task Force Member | Mozilla Bangladesh
fb.com/nhasive | @nhasive | Skype: nhasive | www.nhasive.com


_______________________________________________
Wikimedia-BD mailing list
Wikimedia-BD@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd



_______________________________________________
Wikimedia-BD mailing list
Wikimedia-BD@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd