فا   |   En
Login
مشاهده‌ مشخصات مقاله

استفاده از شبکه‌های باور عمیق برای افزایش مقاومت بازشناسی گفتار در حضور نویز

Authors
  • محبوبه فراهت
  • کمال جمشیدی
  • امیر حسن منجمی
Conference نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract مدل مخلوط گاوسی و ضرایب فرکانسی مل همواره به عنوان مهم‌ترین روش‌های مدل‌سازی توزیع نمونه‌ها و استخراج ویژگی در شناسایی گفتار مطرح بوده‌اند. مزیت مدل مخلوط گاوسی در مدل‌سازی ورودی‌ها با بالاترین دقت و مزیت ضرایب فرکانسی مل در یافتن اطلاعات تمایزدهنده در طیف زمانی کوتاه است. ویژگی‌های طیف زمانی کوتاه مقاومت لازم در مقابل نویز را ندارند، از طرفی اما به‌کارگیری اطلاعات در بازه‌های زمانی طولانی‌تر نیز در مدل مخلوط گاوسی بار محاسباتی بالایی دارد. این مسائل کاهش دقت را در صورت وجود عدم تطابق در شرایط آموزش و آزمون باعث می‌شود. ترکیب ویژگی‌های مختلف و تغییر در مدل‌سازی نمونه‌های ورودی از جمله راه‌های پیشنهادی هستند. در این مقاله از شبکه‌های باور عمیق برای یافتن ویژگی‌های تمایزدهنده از یک طیف زمانی طولانی‌تر استفاده می‌شود. در این حالت تبدیلات غیرخطی علاوه بر استخراج ویژگی‌های سطح بالاتر و کاهش ابعاد ویژگی‌های ورودی، تبدیل فضای ویژگی‌های ضرایب فرکانسی مل را منجر می‌شود که می‌توانند در مقابل تغییرات سیگنال ورودی مقاومت لازم را داشته باشند. این ویژگی‌ها در بهبود کارایی مدل مخفی مارکوف استفاده می‌شوند. روش پیشنهادی بر روی مجموعه‌ای از پرکاربردترین کلمات فارس-دات آزمایش و نتایج آن با پرکاربردترین روش شناسایی گفتار مقایسه شده است. افزایش دقت شناسایی کلمات نشان از کارایی روش پیشنهادی در مقابل تغییرات و نویز دارد.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله