آشکارسازی و بازشناسی یکپارچه متن از تصاویر طبیعی با به‌کارگیری فرهنگ لغت

Autor: فاطمه نعیمی, وحید قدس, حسن خالصی
Jazyk: perština
Rok vydání: 2020
Předmět:
Zdroj: پردازش سیگنال پیشرفته, Vol 4, Iss 1, Pp 133-149 (2020)
Druh dokumentu: article
ISSN: 2676-3397
2676-3400
DOI: 10.22034/jasp.2020.13293
Popis: در سال‌های اخیرآشکارسازی و بازشناسی متن در تصاویر طبیعی به‌طور گسترده مورد مطالعه قرار گرفته است. در این پژوهش، یک سیستم مکان‌یابی متن در صحنه چندجهته مقاوم برای به دست آوردن بازدهی بالا در آشکارسازی متن بر اساس شبکه عصبی پیچشی(CNN) ارائه شده است. روش پیشنهادی شامل سه لایه استخراج ویژگی، ادغام ویژگی و خروجی می‌باشد. در لایه استخراج ویژگی، یک لایه ReLU بهبود یافته(i.ReLU) معرفی شده است. همچنین به‌منظورآشکارسازی متون با ابعاد متنوع، یک لایه inception بهبود یافته (i.inception) ارائه شده است. سپس، برای بهبود استخراج ویژگی از یک لایه اضافی استفاده شده است که ساختار پیشنهادی را قادر می‌سازد متون چندجهته حتی منحنی و عمودی را آشکارسازی نماید. همچنین، یک چارچوب خط لوله برای بازشناسی کاراکتر پیشنهاد نموده‌ایم. چارچوب خط لوله پیشنهادی شامل دو خط لوله موازی است که به‌طور هم‌زمان پردازش می‌شوند. خط لوله اول، متشکل از کلمات برش یافته و خط لوله دوم شامل زوایای متن می‌باشد. سپس، یک فرهنگ لغت جهت اصلاح خطای احتمالی کلمات بازشناسی شده استفاده نمودیم. آزمایش‌ها بر روی مجموعه داده‌های ICDAR 2013، ICDAR 2015 وICDAR 2019، نشان از برتری بارز سیستم پیشنهادی نسبت به کارهای پیشین دارد.
Databáze: Directory of Open Access Journals