فا   |   En
Login
مشاهده‌ مشخصات مقاله

بهبود روش MLLR با استفاده از MCE و دانش آوائي براي تطبيق گوينده

Authors
  • بهزاد زمانی
Conference شانزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫
Abstract روش رگرسيون خطي با بيشينه درست¬نمايي (MLLR) يکي از روش¬هاي تطبيق گوينده است که با خوشه¬بندي پارامترهاي مدل و تخمين ماتريس تبديل براي هر خوشه و اعمال تبديل بر پارامترهاي مدل ، باعث بهبود عملکرد تطبيق و در نتيجه افزايش نرخ بازشناسي براي گوينده جديد مي¬شود. خوشه¬بندي پارامترهاي مدل معمولاً به دو صورت انجام مي¬شود: بر اساس دانش آوايي و نزديکي ويژگي¬ها در فضاي آکوستيکي. در اين مقاله با استفاده از روش متمايزسازي خطاي کمينه کلاس¬بندي با متمايز کردن ويژگي¬هاي سيگنال گفتار با بهبود کلاس¬بندي، کارآيي روش MLLR بهبود يافته است. اين بهبود در حالت اول با متمايزتر کردن کلاس¬هاي رگرسيون و در حالت دوم با يکنواخت کردن توزيع مخلوط¬هاي گوسي در کلاس¬هاي رگرسيون ايجاد مي¬شود. روش پيشنهادي يعني بكارگيري خطاي كمينه كلاس¬بندي نسبت به روش¬هاي معادل بدون خطاي كمينه كلاس¬بندي، به ترتيب باعث افزايش نسبي %0.42 تا %0.58 و %0.12 تا %0.72 در نرخ بازشناسي واج به ترتيب براي دادگان TIMIT و WSJ مي گردد. در حالتي است که درخت کلاس رگرسيون بر اساس نزديکي ويژگي¬ها در فضاي آکوستيکي ساخته شده است ، نرخ بازشناسي واج بر روي دادگان TIMIT %0.25 افزايش نسبي يافته است.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله