சமீபத்தில் தமிழர்களின் நெடுநாள் கனவான OCR, எழுத்துணரியை கூகுள் இலவசமாக
வெளியிட்டுள்ளது. Google Drive ல் ஒரு படத்தை ஏற்றி, அதை Google Doc ஆகத்
திறந்தால் OCR செய்யப்பட்டு, படமும் அதற்கான உரையும் கிடைக்கிறது. தமிழ்
உள்ளிட்ட 200 மொழிகளில் கிடைக்கிறது.
இதற்கான செய்முறை இதோ.
http://www.thewindowsclub.com/google-drive-convert-image-to…
Google Drive இல் 2MB இற்கு குறைவான படக்கோப்பினை தரவேற்றம் செய்யுங்கள்
.பின்னர் அந்த கோப்பில் வலது கிளிக் செய்து Google Doc ஊடாக திறந்தால்
அது சொற்கோப்பாக மாறிவிடும்.
ஒரு பெரிய நூலின் ஒவ்வொரு படமாக ஏற்றி, அதை OCR செய்து உரையாக மாற்றி
சேமிப்பது கடினம். அதை தானியக்கமாகச் செய்ய ஒரு மென்பொருள்
உருவாக்கியுள்ளேன். லினக்ஸ் இயங்குதளத்தில் பைதான் மொழியில் எழுதினேன்.
கட்டற்ற மென்பொருளான இதன் மூலநிரலை இங்கே பதிவிறக்கலாம்.
https://github.com/tshrinivasan/google-ocr-python
https://www.youtube.com/watch?v=PH9TnD67oj4
இந்தக் காணொளியில் கூகுள் எழுத்துணரியைக் கொண்டு ஒரு முழு PDF கோப்பை
தானியகமாக உரையாக மாற்றும் நிரலைப் பயன்படுத்தும் முறையை
விளக்கியுள்ளேன்.
இதனை மேம்படுத்தவும், பிற இயக்குதளங்களுக்கு மாற்றவும் விரும்புவோர்
செய்து கொள்ளலாம்.
http://www.thewindowsclub.com/google-drive-convert-image-to…
Google Drive இல் 2MB இற்கு குறைவான படக்கோப்பினை தரவேற்றம் செய்யுங்கள்
.பின்னர் அந்த கோப்பில் வலது கிளிக் செய்து Google Doc ஊடாக திறந்தால்
அது சொற்கோப்பாக மாறிவிடும்.
ஒரு பெரிய நூலின் ஒவ்வொரு படமாக ஏற்றி, அதை OCR செய்து உரையாக மாற்றி
சேமிப்பது கடினம். அதை தானியக்கமாகச் செய்ய ஒரு மென்பொருள்
உருவாக்கியுள்ளேன். லினக்ஸ் இயங்குதளத்தில் பைதான் மொழியில் எழுதினேன்.
கட்டற்ற மென்பொருளான இதன் மூலநிரலை இங்கே பதிவிறக்கலாம்.
https://github.com/tshrinivasan/google-ocr-python
https://www.youtube.com/watch?v=PH9TnD67oj4
இந்தக் காணொளியில் கூகுள் எழுத்துணரியைக் கொண்டு ஒரு முழு PDF கோப்பை
தானியகமாக உரையாக மாற்றும் நிரலைப் பயன்படுத்தும் முறையை
விளக்கியுள்ளேன்.
இதனை மேம்படுத்தவும், பிற இயக்குதளங்களுக்கு மாற்றவும் விரும்புவோர்
செய்து கொள்ளலாம்.