انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

تطبیق به گوینده سیستم بازشناسی گفتار فارسی با استفاده از تجزیه چند بعدی مدل‌های گوینده‌های آموزشی

حسن قلی‌پور, فرشاد الماس گنج, آزیتا فاضل‌خواه

نویسنده (ها)

هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران

مربوط به کنفرانس

هدف از تطبيق به گوينده در سيستم­هاي مستقل از گوينده، شيفت دادن و نزديک کردن مدل صوتي مستقل از گوينده به مدل وابسته به گوينده جديد، جهت افزايش کارايي سيستم باز شناخت گفتار اتوماتيک مي­باشد. در اين گزارش يک روش جديد تطبيق به گوينده بر اساس تجزيه و تحليل چند بُعدي گوينده­های آموزشي با استفاده از تجزيه­ی تاکر ارائه مي­شود. تجزيه تاکرِ مدل­هاي آموزشي مي­تواند مجموعه داده­ها را به زير فضاهاي حالت، بُعد بردار ميانگين و گوينده تجزيه کند. با استفاده از پايه­هاي حاصله از زير فضاي حالت، یک فرمول تطبيق به گوينده استخراج مي­شود که در آن ماتريسِ بردارهاي پايه در فضاي سطر و ستون وزن­دهي مي­شوند. روش ارائه شده مي­تواند تکنيک صداي ويژه را به عنوان زير­مجموعه شامل شود. روش پيشنهادي براي داده تطبيقي بيشتر از حدود 16 ثانيه عملکرد بهتري نسبت به روش صداي ويژه دارد و تا حدودِ داده تطبيقي 22 ثانيه عملکرد بهتري نسبت به MLLR دارد. همچنين درصد بازشناسي واج مدل مستقل از گوينده را حدود 6% افزايش داده است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت