বাংলা ওসিআর ( Bengali OCR) প্রকাশিত হয়েছে। জেনে খুশি হলাম। ধন্যবাদ। শুভ হোক পথ চলা।
On Friday, August 8, 2014 10:34 PM, Jayanta Nath jayantanth@gmail.com wrote:
আমার আলোচিত বাংলা ওসিআর ( Bengali OCR) প্রকাশিত হয়েছে। বাংলাদেশের প্রায় সকল সংবাদপত্রে তা প্রকাশ ও হয়েছে। অনলাইনে ব্যবহার করার জন্য http://www.puthiocr.com/ এর মাধ্যমে এইটি পাওয়া যাবে বলে দাবি করা হয়েছে।
বিঃদ্রঃ আরও একটি তথ্য জানতে পারলাম, এখান থেকে [১][২] , কলকাতার ISI (Indian Statistical Institute) এর বানানো বাংলা OCR দিয়ে কনভার্ট করা প্রথম বাংলা বই। এই গ্রন্থটি মাননীয় বিদ্যুৎ বরণ চৌধুরীর তত্বাবধানে বাংলা OCR দ্বারা নির্মিত। আমরা লাইব্রেরীর পক্ষ থেকে তাঁর কাছে চিরকৃতজ্ঞ। এতদিন আমরা কম্পোজ করে সমস্ত কিছু আপডেট দিতাম। সেই অক্লান্ত পরিশ্রমের হাত থেকে বিদ্যুতবাবু আমাদের মুক্তি দিয়েছেন। ওনার তৈরী Bangla OCR Software নব্বই ভাগ পর্যন্ত নির্ভূল ভাবে বাংলা ডেটাকে ইমেজ ফাইল থেকে টেক্সট এ রূপান্তরিত করতে পারে। আশা করি ভবিষ্যতে এটি ১০০ ভাগ নির্ভূল হয়ে উঠবে।
মানে Bangla OCR Software তৈরি করে নিজেদের কুক্ষিগত করে রাখার কি মানে!
১)http://www.somewhereinblog.net/blog/mamonjafran/29882993 ২)http://forum.banglalibrary.org/viewtopic.php?id=2177%E0%A5%A4
2014-05-25 16:07 GMT+05:30 Jayanta Nath jayantanth@gmail.com:
@হাসিব, ধন্যবাদ, আসলে প্রথম আলো ছাড়া প্রায় সব সংবাদপত্রে খবরটা থাকাতে আমার প্রথমে সন্দেহ হয়েছিল, এটা পেইড নিউজ কিনা। এখন বোঝাই যাচ্ছে আসল ঘটনা। সত্যিই কোনো ঠিকঠাক কাজ হলে তোমার কাছে খবরটা আসত আগে। যাই হোক দেখা যাক অনেক বাংলা ওসিআর ( Bengali OCR) প্রকল্পের মত এটাও শুধু খবর হয়ে থাকবে , নাকি বাস্তবের মুখ দেখবে, সেটা ভবিষ্যতই বলবে। তোমার রিপোর্টের অপেক্ষায় থাকবো।
@ মইনুল, তোমার কথার সপক্ষে অনেক কথাই বলতে হয়, কিছু কথা এখানে সেয়ার করা দরকার বলেই মনে করি, কারন কথাগুলো এখানে পাবলিকলি থাক সবাই দেখুক, বা জানুক বাংলা কম্পিউটিং এর বর্তমান কি অবস্থা, অবশ্যই বাংলা ওসিআর ( Bengali OCR) প্পরিপেক্ষিতেই কথাগুলি বলা। আমি ভুল হতে পারি তবে আমার জানা মতে বাংলা ওসিআর ( Bengali OCR) প্রথম ওপেন সোর্স প্রকল্পে কাজ শুরু করেঅঙ্কুর গ্রুপ [2] [3]। বাংলা ওসিআর ( Bengali OCR) এর
প্রয়োজনীয়তা আমরা সবাই অনুভব করছি ও করে চলেছি। বাংলা কম্পিউটিং এর ক্ষেত্রে এটা এক পরিচিত সমস্যা। এখনো পর্যন্ত বাংলা লিপির প্রামান্য ওসিআর নেই। এটা বাংলার জন্য দুর্ভাগ্যের। এমন কি ভারতীয় কোন ভাষায় ওসিআর নেই। জানি এটি অনেক গবেষণার ব্যাপার। তবে কিছু কিছু জায়গায় ওসিআর তৈরির কাজ হয়েছে ও হচ্ছে। প্রামান্য ওসিআর কবে পাওয়া যাবে সেই ব্যাপারে আমার কিছু বলার নেই, তবে ইংরেজি লিপি নিয়ে অনেক গবেষণা হয়েছে বলেই ওসিআর তৈরির কাজটা সহজ হয়েছিল, বাংলার ক্ষেত্রে তেমন কোনো গবেষণা হচ্ছে বলে আমার জানা নেই। বাঙালি বা বাংলার বিশ্ববিদ্যালয় এই ব্যপারে এগিয়ে আসলেই তবে সম্ভব হবে। বাংলার বিশ্ববিদ্যালয় গুলি বা আপামর বাঙ্গালী জাতি নিজের ভাষা বা লিপি সম্পর্কে খুবই উদাসিন। বাংলা লিপির উপর কয়জন পিএইচ ডি করে আমার জানা নেই। আর এখন তো কপি পেস্টের যুগ, ছাত্ররা থিসিস লেখে উইকিপিডিয়া থেকে কপি পেস্ট করে। এতো বছরেও বাঙ্গালিরা একটা বাংলা ওসিআর সফটওয়্যার তৈরি করতে পারলো না। এটা খুব বেদনার।
অঙ্কুর গ্রুপের বাংলা ওসিআর ( Bengali OCR) প্রকল্পের কি অবস্থা আজ ও আমার জানা নেই। অঙ্কুর মুক্ত সফটওয়্যার গ্রুপের কেউই এই বিষয়ে মেইলের উত্তর দেয় না। [4] ব্যাবহার করে দেখার মত কোনো EXE বা BIN কিছুই নেই বা পাওয়া যায় না। কোথায় আছে কেউ সন্ধান দেয় না।
ভারতেও সরকারি ভাবে কি হচ্ছে তাদের অয়েব সাইট থেকে জানা যায়, কিন্তু কোনও অশ্বডিম্ব পাওয়া যায়নি। যেমন সিড্যাক [1] বা ভাষা প্রযুক্তি গবেষণা পরিষদ [1]। আর সাথে রয়েছে ভারতের দুর্নীতি, বাংলা ওসিআর ( Bengali OCR) তৈরি করবে বলে টাকা নিয়ে Indian Statistical Institute এর কোনো এক অধিককর্তা নাকি কেন্দ্রীয় সরকারের কোটি কোটি টাকা মেরে দিয়েছে, কিন্তু বাংলা ওসিআর ( Bengali OCR) পাওয়া যায় নি। [7]
যাই হোক ২০০৯ সালের শেষ দিকে বাংলাদেশের ব্রাক ইউনিভার্সিটির একটা প্রোজেক্ট সেন্টার ফর রিসার্চ অন বাংলা লেংগুয়েজ প্রসেসিং (সিআরবিএলপি ) থেকে একটি বাংলা ওসিআর ( Bengali OCR) তৈরি করেছিল। [5] এটা ওপেন সোর্স গুগুল কোডে [6] রাখা আছে, যা আমিও ব্যবহার করি , তুমিও দেখতে পারো। মইনুল তুমি যে প্রজ্রক্টের কথা বলছিলে এটা সেটাই। যার মুল ডেভলপারে একজন আবুল হাসনাতের সঙ্গে আমি কয়েকবার এই
প্রজেক্টের ব্যপারে কথা বলেছি। এই প্রকল্পের সব কাজের অগ্রগতিতে আমি নজরে রেখেছিলাম, কারন এরাই একমাত্র প্রকল্প যা তারা অপেন সোর্স করেছিল। আর অন্যেরা কি কাজ করেছে বা করছে কিছুই জানা যায়নি। প্রকল্পের আরও বিস্তারিত পাবে এখানে। [8] এই বাংলা ওসিআর ( Bengali OCR) টিকেই আমি বাংলা উইকিসংকলনে ইন্সস্টল করেছি, পরিক্ষামূলকভাবে। এটি ব্যাবহার করা যাবে প্রুফপেজে পাতাকে সম্পাদনা করার সময়। আমার জানা মতে এটাই একমাত্র বাংলা ওসিআর ( Bengali OCR) যা ব্যবহার করা যায়। তবে খুব ভাল স্ক্যানের ক্ষেত্রে কাজ করে প্রায় ৭০%। বাংলাদেশের ব্রাক ইউনিভার্সিটির প্রোজেক্টের মুল ডেভলপার ও প্রাক্তন ছাত্র মহঃ আবুল হাসনাত বর্তমানে ব্যক্তিগত জীবনে ব্যস্ত থাকায় প্রকল্পটির কোনো কাজের অগ্রগতি নেই বা অন্য কেউ সোর্স কোড নিয়ে কাজও করেনি। এটাইতে উন্নয়ন করার কাজ আর ও আছে। এবং তা করতে হবে। আমাদের দুই বাংলার মধ্যে কি মেহেদি হাসানের (যে অভ্র তৈরি করে এক বিপ্লব সাঙ্গ করেছে) মত এমন কেউ নেই যে , একটা বাংলা ওসিআর ( Bengali OCR) তৈরি করে দিতে পারে? অন্য কোনো বাংলা ওসিআর ( Bengali OCR) কে আমাদের মতো প্রক্টিক্যাল ফিল্ডে ব্যবহার করার মত অবস্থায় নেই, যে আমরা মানে , বাংলা উইকিসম্প্রদায় সেটা ব্যবহার করবে। কোথাও কোথাও কোনো গ্রুপ বা কোম্পানি ঢাকঢোল পিটিয়ে এমনই বাংলা ওসিআর ( Bengali OCR) করছি বা করা হচ্ছে বলে, কিন্তু একটাও অশ্বডিম্ব পাইনি পাওয়া যায় না। জানি একটা ভাল বাংলা ওসিআর ( Bengali OCR) জন্য আমাদের আর কটা যুগ অপেক্ষা করতে হবে।
1)http://ocr.cdacnoida.in/, http://www.cdac.in/html/press/archives/atjp02/prs_rl114.aspx, 2)https://en.wikipedia.org/wiki/Ankur_Group 3) http://www.ankur.org.bd/wiki/Home 4)http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/2014-February... 5) http://www.panl10n.net/center-for-research-on-bangla-language-processing-crb...
6)https://code.google.com/p/banglaocr/
7)http://ddts.randomink.org/blog/?p=17 8) http://crblpocr.blogspot.in/
2014-05-19 10:46 GMT+05:30 Mayeenul Islam wz.islam@gmail.com:
এরও বহু বছর আগে একুশে টেলিভিশনের সর্বময় বাংলা ঘরাণার একটি প্রতিবেদনে বাংলার উপর অনেকগুলো কাজের একটা হিসেবে ব্র্যাক বিশ্ববিদ্যালয়ের ছাত্রদের করা একটা ওসিআর-এর কাজের ব্যাপারে জানি। কিন্তু ওটারও আর কোনো আপডেট পাইনি।
অপেক্ষায় আছি...
Mayeenul Islam Front-end Designer & WordPress Developer
email: wz.islam@gmail.com blog: nishachor.com Bangla Wikipedia Editor| Founding member of Wikimedia Bangladesh
2014-05-19 11:03 GMT+06:00 Nurunnaby Chowdhury nh@nhasive.com:
জয়ন্ত দা,
এটার আর কোন আপডেট নেই। উদ্যোক্তারা এখনও পুরোপুরি চালুর তারিখও জানাতে পারেননি। তবে কাজ চলছে। কাজ চলা অবস্থায়ই নিউজ হয়ে গেছে!
2014-05-19 0:17 GMT+06:00 Jayanta Nath jayantanth@gmail.com:
প্রিয় সবাই,
কয়েকদিন আগে বাংলাদেশের অনেক সংবাদ মাধ্যমে বাংলা ওসিআর সংক্রান্ত একটি খবর প্রকাশিত হয়েছিল, এই খবরের শেষ কোনো আপডেট কেউ দিতে পারেন?
http://www.dbarta.com/?p=13646 http://www.dhakatimes24.com/2014/03/12/17661 http://www.kalerkantho.com/feature/techbishaw/2014/04/02/68179 http://www.ittefaq.com.bd/index.php?ref=MjBfMDVfMThfMTNfMV8xOF8xXzQxNDky http://www.alokitobangladesh.com/development-possibility/2014/04/02/63386 http://tm-engine.com/project-research.php
জয়ন্ত
Wikipedia-BN mailing list Wikipedia-BN@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipedia-bn
--
Nurunnaby Chowdhury Hasive Administrator | Bengali Wikipedia Member | IEG Committee, Wikimedia Foundation Social Media Interaction Expert | The Daily Prothom-Alo Bangladesh Ambassador | Open Knowledge Foundation Network Treasurer | Bangladesh Open Source Network (BdOSN) Task Force Member | Mozilla Bangladesh fb.com/nhasive | @nhasive | Skype: nhasive | www.nhasive.com
Wikimedia-BD mailing list Wikimedia-BD@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd
Wikimedia-BD mailing list Wikimedia-BD@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd
_______________________________________________ Wikimedia-BD mailing list Wikimedia-BD@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd