دانلود پایان نامه ارشد مهندسی برق: تشخیص حروف صدا دار از روی تصاویر لب |
الگوریتم
مرحله بعد توسط پارامترهای تعریف شده، یكسری ویژگی مربوط به تصاویر لب را استخراج می نماییم . در آخر
توسط شبكه عصبی به دستهبندی ویژگیها و تشخیص واكهها میپردازیم.
مقدمه
كارایی ضعیف سیستمهای تشخیص صوت و سیستمهای تصدیق گوینده در محیطهای نویزی سبب شد تا
محققان به فكر استفاده از اطلاعات دیداری در این سیستمها باشند به همین دلیل آنالیز تصاویر لب، توجه
زیادی را به خود جلب نمود. اولین گام در آنالیز تصاویر لب، استخراج 1 ناحیه مربوط به لب در تصاویر می باشد .
افزایش علاقه در استخراج این اطلاعات توسط بخشبندی تصاویر لب سبب بوجود آمدن روش های گوناگون و
بهبود عملكرد سیستمهای صوتی – تصویری در تشخیص صوت گردید . بزرگترین مشكل در سیستم ه ای
لبخوانی 2 توصیف كمی لب میباشد. معمولاً روشهای توصیف لب را به دو دسته، یكی روشهای سطح پایین
(روشهای مبتنی بر تصویر) و دیگری روشهای سطح بالا (روشهای مبتنی بر مدل) تقسیم مینمایند . دقت و
مقاوم بودن در این فرآیند، مهمترین كلید برای پردازشهای مراحل بعدی میباشد زیرا هر چه این مرحله با
دقت بیشتری انجام شود و بخشبندی ناحیه لب در تصاویر بهتر صورت گیرد مدل نمودن لب راحت تر خواهد
بود و با سهولت بیشتری میتوان ویژگیهای لب را استخراج نمود. گام بعدی بعد از استخراج ویژگی های لب،
دسته بندی و تشخیص ویژگی ها میباشد. در پروژه جاری ما نیز به بررسی تك تك این مراحل و ارائه راهكار
برای بهبود این مراحل میپردازیم.
فصل اول
ی بر روش ها
مقدمه
از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین انسان ها از اهمیت بسیاری
برخوردار بوده است. تاكنون تكنیكهای بازشناسی صحبت با استفاده از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بكار گرفته شدهاند. اما وجود نویز در برخی شرایط عامل اصلی بروز اشتباهات اساسی در تشخیص
بوده است كه در این گونه موارد استفاده از پردازش تصویر و به ویژه بررسی شكل لبها و حركت آنها می تواند
فرم در حال بارگذاری ...
[پنجشنبه 1399-10-18] [ 03:10:00 ق.ظ ]
|
پاسخ دهید