مشاهده مشخصات مقاله
تطبیق به گوینده سیستم بازشناسی گفتار فارسی با استفاده از تجزیه چند بعدی مدلهای گویندههای آموزشی
نویسنده (ها) |
-
حسن قلیپور
-
فرشاد الماس گنج
-
آزیتا فاضلخواه
|
مربوط به کنفرانس |
هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
هدف از تطبيق به گوينده در سيستمهاي مستقل از گوينده، شيفت دادن و نزديک کردن مدل صوتي مستقل از گوينده به مدل وابسته به گوينده جديد، جهت افزايش کارايي سيستم باز شناخت گفتار اتوماتيک ميباشد. در اين گزارش يک روش جديد تطبيق به گوينده بر اساس تجزيه و تحليل چند بُعدي گويندههای آموزشي با استفاده از تجزيهی تاکر ارائه ميشود. تجزيه تاکرِ مدلهاي آموزشي ميتواند مجموعه دادهها را به زير فضاهاي حالت، بُعد بردار ميانگين و گوينده تجزيه کند. با استفاده از پايههاي حاصله از زير فضاي حالت، یک فرمول تطبيق به گوينده استخراج ميشود که در آن ماتريسِ بردارهاي پايه در فضاي سطر و ستون وزندهي ميشوند. روش ارائه شده ميتواند تکنيک صداي ويژه را به عنوان زيرمجموعه شامل شود.
روش پيشنهادي براي داده تطبيقي بيشتر از حدود 16 ثانيه عملکرد بهتري نسبت به روش صداي ويژه دارد و تا حدودِ داده تطبيقي 22 ثانيه عملکرد بهتري نسبت به MLLR دارد. همچنين درصد بازشناسي واج مدل مستقل از گوينده را حدود 6% افزايش داده است. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|