مشاهده مشخصات مقاله
واژهیابی گفتار مبتنی بر مدلهای مطرح شبكههای عصبی پیچشی به كمك مكانیزم خود توجه
Authors |
-
بهنام اوجاقی
-
شیما طبیبیان
|
Conference |
بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران |
Abstract |
واژهیابی گفتار به جستجوی کلمات كلیدی هدف در یک آرشیو صوتی اتلاق میشود. در سالهای اخیر با پیشرفت تکنولوژی استفاده از سیستمهای واژهیاب گفتار در دستگاههای با توان پردازشی كم مانند بلندگوهای هوشمند و تلفنهای همراه رواج یافته است. استفاده از واژهیابی گفتار در این دستگاهها با محدودیتهای حافظهای و پردازشی همراه است. از این رو، لازم است از روشهایی استفاده شود که در كنار دقت مطلوب، تعداد پارامترهای كمی نیز داشته باشد. در سالهای اخیر، شرکت گوگل مبتنی بر مدهای مطرح شبکههای عصبی پیچشی مانند موبایل نت، تیسی رزنت، اینسپشن و اکسپشن در حوزهی واژهیابی گفتار به دقت مطلوبی دست یافته است. در این مقاله سعی شده است با بهرهگیری از مکانیزم خودتوجه، دقت واژهیابی گفتار مبتنی بر مدلهای مطرح مذکور افزایش یابد. نتایج ارزیابی حاکی از آن است که استفاده از مکانیزم خودتوجه باعث افزایش دقت %1.72ای مدل موبایلنت، %1.411ای مدل اینسپشن، %1.43ای مدل اكسپشن و %1.83ای مدل تیسیرزنت بدون تاثیر قابل توجه بر تعداد پارامترهای آموزش پذیر مدلهای مذکور شده است. همچنین، در قیاس با سایر مدلهای مطرح در حوزهی واژهیابی گفتار، در بهترین حالت، به ازای کاهش حدود 2 درصد دقت، تعداد پارامترهای آموزش پذیر مدل 1000 برابر کاهش یافتهاند. |
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|