Tuesday, September 29, 2015

கூகுளின் இலவச எழுத்துணரியை எளிதாக்க ஒரு கட்டற்ற மென்பொருள்


சமீபத்தில் தமிழர்களின் நெடுநாள் கனவான OCR, எழுத்துணரியை கூகுள் இலவசமாக
வெளியிட்டுள்ளது. Google Drive ல் ஒரு படத்தை ஏற்றி, அதை Google Doc ஆகத்
திறந்தால் OCR செய்யப்பட்டு, படமும் அதற்கான உரையும் கிடைக்கிறது. தமிழ்
உள்ளிட்ட 200 மொழிகளில் கிடைக்கிறது.


இதற்கான செய்முறை இதோ.
http://www.thewindowsclub.com/google-drive-convert-image-to…

Google Drive இல் 2MB இற்கு குறைவான படக்கோப்பினை தரவேற்றம் செய்யுங்கள்
.பின்னர் அந்த கோப்பில் வலது கிளிக் செய்து Google Doc ஊடாக திறந்தால்
அது சொற்கோப்பாக மாறிவிடும்.

ஒரு பெரிய நூலின் ஒவ்வொரு படமாக ஏற்றி, அதை OCR செய்து உரையாக மாற்றி
சேமிப்பது கடினம். அதை தானியக்கமாகச் செய்ய ஒரு மென்பொருள்
உருவாக்கியுள்ளேன். லினக்ஸ் இயங்குதளத்தில் பைதான் மொழியில் எழுதினேன்.
கட்டற்ற மென்பொருளான இதன் மூலநிரலை இங்கே பதிவிறக்கலாம்.
https://github.com/tshrinivasan/google-ocr-python

https://www.youtube.com/watch?v=PH9TnD67oj4
இந்தக் காணொளியில் கூகுள் எழுத்துணரியைக் கொண்டு ஒரு முழு PDF கோப்பை
தானியகமாக உரையாக மாற்றும் நிரலைப் பயன்படுத்தும் முறையை
விளக்கியுள்ளேன்.

இதனை மேம்படுத்தவும், பிற இயக்குதளங்களுக்கு மாற்றவும் விரும்புவோர்
செய்து கொள்ளலாம்.

No comments: