تطبیق به گوینده سیستم بازشناسی گفتار فارسی با استفاده از تجزیه چند بعدی مدل‌های گوینده‌های آموزشی

مشاهده‌ مشخصات مقاله

تطبیق به گوینده سیستم بازشناسی گفتار فارسی با استفاده از تجزیه چند بعدی مدل‌های گوینده‌های آموزشی

حسن قلی‌پور, فرشاد الماس گنج, آزیتا فاضل‌خواه

نویسنده (ها)

هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران

مربوط به کنفرانس

هدف از تطبيق به گوينده در سيستمهاي مستقل از گوينده، شيفت دادن و نزديک کردن مدل صوتي مستقل از گوينده به مدل وابسته به گوينده جديد، جهت افزايش کارايي سيستم باز شناخت گفتار اتوماتيک ميباشد. در اين گزارش يک روش جديد تطبيق به گوينده بر اساس تجزيه و تحليل چند بُعدي گويندههای آموزشي با استفاده از تجزيهی تاکر ارائه ميشود. تجزيه تاکرِ مدلهاي آموزشي ميتواند مجموعه دادهها را به زير فضاهاي حالت، بُعد بردار ميانگين و گوينده تجزيه کند. با استفاده از پايههاي حاصله از زير فضاي حالت، یک فرمول تطبيق به گوينده استخراج ميشود که در آن ماتريسِ بردارهاي پايه در فضاي سطر و ستون وزندهي ميشوند. روش ارائه شده ميتواند تکنيک صداي ويژه را به عنوان زيرمجموعه شامل شود. روش پيشنهادي براي داده تطبيقي بيشتر از حدود 16 ثانيه عملکرد بهتري نسبت به روش صداي ويژه دارد و تا حدودِ داده تطبيقي 22 ثانيه عملکرد بهتري نسبت به MLLR دارد. همچنين درصد بازشناسي واج مدل مستقل از گوينده را حدود 6% افزايش داده است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت

خرید مقاله