مشاهده مشخصات مقاله
محسن محمدی, حمیدرضا صادق محمدی
بیست و دومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
استفاده از گفتار برای تشخیص هویت افراد با وجود مزایای زیادی چون کاربرپسند بودن و پیچیدگی پیادهسازی کم، محدودیتهایی نیز دارد که از آن جمله میتوان به کاهش دقت این روش در محیطهای واقعی به دلیل حضور نویزهای مختلف اشاره کرد. تا کنون روشهای گوناگونی برای حل این مشکل در مراحل مختلف سیستم تایید هویت گوینده یعنی استخراج ویژگی، مدلسازی و مقایسه و امتیازدهی ارائه شده است که البته هیچکدام مصون از خطا نیستند. ترکیب روشهای مختلف در مراحل گوناگون یک راهحل مرسوم برای بهبود کارایی سیستمهای تشخیص هویت است. در این مقاله تاثیر ترکیب ویژگیهای مختلف در مرحله امتیازات بر کارایی سیستم تایید هویت گوینده، برای چهار بردار ویژگی MFCC، LFCC، IMFCC و PNCC، در شرایط گفتار تمیز و نویزی مورد ارزیابی و مقایسه قرار گرفته است. مدلسازی گوینده در فضای بردارهای هویت و بر مبنای الگوریتم i-Vector/PLDA انجام گرفته و در پیادهسازی آزمونها برای سیگنال گفتار و نویز به ترتیب از دادگانهای TIMIT و NOISEX-92 استفاده گردیده است. نتایج آزمونها نشان میدهد ترکیب امتیازات حاصل از بردارهای متفاوت انرژی خطای سیستم تایید هویت گوینده را كاهش میدهد و این کاهش در برخی حالات بسیار چشمگیر است.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال