فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

معرفی یک سیستم تشخیص‌دهنده گفتار از غیرگفتار بر اساس ضرایب کپسترال فرکانس بارک برای شناسایی گوینده

نویسنده (ها)
  • فهیمه جمهوری شوکت آباد
  • حسین مروی
  • علیرضا احمدی‌فرد
مربوط به کنفرانس بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده امروزه سیستم‌های شناسایی گوینده کاربردهای بسیار گسترده‌ای دارند. یک سیستم شناسایی گوینده مقاوم نیاز به یک سیستم تشخیص‌دهنده گفتار از غیرگفتار با کیفیت خوب دارد. این سیستم تشخیص‌دهنده با حذف قسمت‌های غیرگفتار، ورودی معتبر را برای سیستم شناسایی گوینده فراهم آورده و کارایی آن را افزایش می‌دهد. سیستم تشخیص‌دهنده گفتار از غیرگفتار پیشنهادی در این مقاله بر مبنای استفاده از ویژگی‌های ضرایب کپسترال فرکانس بارک و انرژی می‌باشد. در این سیستم‌ با استفاده از الگوریتم k-means ، فریم‌های گفتار و غیرگفتار آموزش می‌بینند. سپس با استفاده از تست نسبت لگاریتم احتمال و یک آستانه انرژی، همه فریم‌های موجود شناسایی و برچسب‌گذاری می‌شوند. جهت مقایسه کارایی روش‌ پیشنهادی از ویژگی‌های ضرایب پیش‌بینی ادراکی خطی نیز استفاده شده است. روش‌های مطرح شده روی دادگان گفتاری استاندارد فارس‌دات تست شده‌اند. نتایج نشان داده‌اند که ضرایب کپسترال فرکانس بارک هنگامی که نسبت سیگنال به نویز کاهش می‌یابد، نسبت به روش ضرایب پیش‌بینی ادراکی خطی کارایی بهتری دارند.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله