مشاهده مشخصات مقاله
محسن محمدی, حمیدرضا صادق محمدی
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
گفتار یک سیگنال مناسب برای تشخیص هویت است که علاوه بر کاربرپسند بودن، دارای پیچیدگی محاسباتی کم و هزینه پیادهسازی پایین است. همچنین به دلیل برخورداری از ویژگیهایی نظیر طبیعی بودن و امکان دسترسی به آن از راه دور، همواره مورد توجه محققان حوزه تشخیص هویت بوده است. تصدیق هویت گوینده بر مبنای تحلیل عامل و در فضای i-vector بهبود چشمگیری در عملکرد این سیستمها در سالهای اخیر ایجاد کرده است. در این مقاله روشی برای وزندهی به بردارهای مدل و تست، با استفاده از ویژگیهای آماری بردارهای آموزشی گویندگان هدف، ارائه شده است. تأثیر بهرهگیری از بردارهای موزون بر دقت امتیازدهی و در نتیجه کل سیستم تصدیق هویت با استفاده از چهار بردار ویژگی MFCC، IMFCC، LFCC و PNCC و دو روش امتیازدهی فاصله كسینوسی و فاصله اقلیدسی وزندار (ماهالانوبیس) مورد ارزیابی قرار گرفته است. در پیادهسازی آزمونها از دادگانهای TIMIT و NIST SRE 2008 استفاده شده است. نتایج آزمونها مبین آن است که استفاده از بردارهای موزون پیشنهادی در این مقاله دقت سیستم تصدیق هویت گوینده را افزایش میدهد.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال