مشاهده مشخصات مقاله
بهبود روش MLLR با استفاده از MCE و دانش آوائي براي تطبيق گوينده
نویسنده (ها) |
|
مربوط به کنفرانس |
شانزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
روش رگرسيون خطي با بيشينه درست¬نمايي (MLLR) يکي از روش¬هاي تطبيق گوينده است که با خوشه¬بندي پارامترهاي مدل و تخمين ماتريس تبديل براي هر خوشه و اعمال تبديل بر پارامترهاي مدل ، باعث بهبود عملکرد تطبيق و در نتيجه افزايش نرخ بازشناسي براي گوينده جديد مي¬شود. خوشه¬بندي پارامترهاي مدل معمولاً به دو صورت انجام مي¬شود: بر اساس دانش آوايي و نزديکي ويژگي¬ها در فضاي آکوستيکي. در اين مقاله با استفاده از روش متمايزسازي خطاي کمينه کلاس¬بندي با متمايز کردن ويژگي¬هاي سيگنال گفتار با بهبود کلاس¬بندي، کارآيي روش MLLR بهبود يافته است. اين بهبود در حالت اول با متمايزتر کردن کلاس¬هاي رگرسيون و در حالت دوم با يکنواخت کردن توزيع مخلوط¬هاي گوسي در کلاس¬هاي رگرسيون ايجاد مي¬شود. روش پيشنهادي يعني بكارگيري خطاي كمينه كلاس¬بندي نسبت به روش¬هاي معادل بدون خطاي كمينه كلاس¬بندي، به ترتيب باعث افزايش نسبي %0.42 تا %0.58 و %0.12 تا %0.72 در نرخ بازشناسي واج به ترتيب براي دادگان TIMIT و WSJ مي گردد. در حالتي است که درخت کلاس رگرسيون بر اساس نزديکي ويژگي¬ها در فضاي آکوستيکي ساخته شده است ، نرخ بازشناسي واج بر روي دادگان TIMIT %0.25 افزايش نسبي يافته است. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|