مشاهده مشخصات مقاله
امیر حسین حاج احمدی, محمدمهدی همایونپور
بیست و دومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
با توجه به اهمیت استفاده از شبکههای عصبی عمیق در بازشناسی خودکار گفتار، در این مقاله با انجام چندین آزمایش مختلف روی مجموعه دادگان گفتاری TIMIT سعی شده است، نحوه استخراج ویژگیهای عمیق گلوگاهی، برای انجام بازشناسی خودکار گفتار مورد بررسی قرار گیرد. همچنین جهت بررسی نوع ویژگیهای گفتاری ورودی، آموزش بانظارت و تاثیر مشتقات زمانی ویژگیهای ورودی آزمایشهایی انجام شده است. از آزمایشهای انجام شده مشخص گردید ویژگیهای گلوگاهی قادر هستند، در مقایسه با ویژگیهای رایج گفتاری مانند MFCC حدود 7 درصد دقت بازشناسی را افزایش دهند. همچنین بهترین دقت بازشناسی از ویژگیهای گلوگاهی مربوط به شبکه آموزش دیده بصورت با نظارت، با استفاده از ویژگیها طیفی مبتنی بر معیار مل (MFSC)، با در نظر گرفتن ویژگیهای مشتق زمانی، حاصل شده است.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال