مشاهده مشخصات مقاله
استفاده از شبکههای باور عمیق برای افزایش مقاومت بازشناسی گفتار در حضور نویز
نویسنده (ها) |
-
محبوبه فراهت
-
کمال جمشیدی
-
امیر حسن منجمی
|
مربوط به کنفرانس |
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
مدل مخلوط گاوسی و ضرایب فرکانسی مل همواره به عنوان مهمترین روشهای مدلسازی توزیع نمونهها و استخراج ویژگی در شناسایی گفتار مطرح بودهاند. مزیت مدل مخلوط گاوسی در مدلسازی ورودیها با بالاترین دقت و مزیت ضرایب فرکانسی مل در یافتن اطلاعات تمایزدهنده در طیف زمانی کوتاه است. ویژگیهای طیف زمانی کوتاه مقاومت لازم در مقابل نویز را ندارند، از طرفی اما بهکارگیری اطلاعات در بازههای زمانی طولانیتر نیز در مدل مخلوط گاوسی بار محاسباتی بالایی دارد. این مسائل کاهش دقت را در صورت وجود عدم تطابق در شرایط آموزش و آزمون باعث میشود. ترکیب ویژگیهای مختلف و تغییر در مدلسازی نمونههای ورودی از جمله راههای پیشنهادی هستند. در این مقاله از شبکههای باور عمیق برای یافتن ویژگیهای تمایزدهنده از یک طیف زمانی طولانیتر استفاده میشود. در این حالت تبدیلات غیرخطی علاوه بر استخراج ویژگیهای سطح بالاتر و کاهش ابعاد ویژگیهای ورودی، تبدیل فضای ویژگیهای ضرایب فرکانسی مل را منجر میشود که میتوانند در مقابل تغییرات سیگنال ورودی مقاومت لازم را داشته باشند. این ویژگیها در بهبود کارایی مدل مخفی مارکوف استفاده میشوند. روش پیشنهادی بر روی مجموعهای از پرکاربردترین کلمات فارس-دات آزمایش و نتایج آن با پرکاربردترین روش شناسایی گفتار مقایسه شده است. افزایش دقت شناسایی کلمات نشان از کارایی روش پیشنهادی در مقابل تغییرات و نویز دارد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|