مشاهده مشخصات مقاله
فهیمه جمهوری شوکت آباد, حسین مروی, علیرضا احمدیفرد
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
امروزه سیستمهای شناسایی گوینده کاربردهای بسیار گستردهای دارند. یک سیستم شناسایی گوینده مقاوم نیاز به یک سیستم تشخیصدهنده گفتار از غیرگفتار با کیفیت خوب دارد. این سیستم تشخیصدهنده با حذف قسمتهای غیرگفتار، ورودی معتبر را برای سیستم شناسایی گوینده فراهم آورده و کارایی آن را افزایش میدهد. سیستم تشخیصدهنده گفتار از غیرگفتار پیشنهادی در این مقاله بر مبنای استفاده از ویژگیهای ضرایب کپسترال فرکانس بارک و انرژی میباشد. در این سیستم با استفاده از الگوریتم k-means ، فریمهای گفتار و غیرگفتار آموزش میبینند. سپس با استفاده از تست نسبت لگاریتم احتمال و یک آستانه انرژی، همه فریمهای موجود شناسایی و برچسبگذاری میشوند. جهت مقایسه کارایی روش پیشنهادی از ویژگیهای ضرایب پیشبینی ادراکی خطی نیز استفاده شده است. روشهای مطرح شده روی دادگان گفتاری استاندارد فارسدات تست شدهاند. نتایج نشان دادهاند که ضرایب کپسترال فرکانس بارک هنگامی که نسبت سیگنال به نویز کاهش مییابد، نسبت به روش ضرایب پیشبینی ادراکی خطی کارایی بهتری دارند.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال