اگر تصویر نمونه در سوال خود قرار می دادید راهنمایی دقیق تری دریافت می کردید.
به هرحال در ابتدا باید محل دقیق اعداد را مکان یابی(localization) کنید اینکار می تونید از این روش نواحی متن را در تصویر پیدا کنید و یا اینکه با استفاده از روش template matching ابتدا ناحیه ای از تصویر را به عنوان مبنا قرار داده و آن ناحیه را پیدا کرده و سپس افست ناحیه متن را نسبت به آن حساب کنید.
اگر هم تصویر چرخش داشته باشه می بایست قبل از شروع عملیات مکان یابی زاویه تصویر را که در اینجا توضیح داده شده مطالعه کنید و از طریق این روش تصویر را دوران دهید.
در مرحله بعد هم باید تصویر را سگمنت کنید یعنی موقعیت تک یک کارکترها را شناسایی کنید که در اینجا و اینجا توضیح داده شده است.
مرحله بعدی نواحی بدست آمده را به سایز مشخصی تغییر اندازه دهید مثلاً 28 *28 (از روش های دقیقا تر نرمالیزیشن تصویر هم می تونید استفاده کنید)
مرحله بعدی اختیاریه بستگی داره چه دقت شناسایی را مد نظر داشته باشید اگر دقت زیادی مدنظر تون نیست از تصویر خام استفاده کنید در غیر اینصورت از تصویر به این روش استخراج ویژگی کنید.
در مرحله آخر نیز ویژگی بدست آمده از مرحله قبل را توسط یک کلاسیفایر تشخیص بدید از جمله این کلاسیفایر ها svm و mlp هستش.