مشاهده مشخصات مقاله
واژهیابی گفتار مبتنی بر مدلهای مطرح شبكههای عصبی پیچشی به كمك مكانیزم خود توجه
نویسنده (ها) |
-
بهنام اوجاقی
-
شیما طبیبیان
|
مربوط به کنفرانس |
بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران |
چکیده |
واژهیابی گفتار به جستجوی کلمات كلیدی هدف در یک آرشیو صوتی اتلاق میشود. در سالهای اخیر با پیشرفت تکنولوژی استفاده از سیستمهای واژهیاب گفتار در دستگاههای با توان پردازشی كم مانند بلندگوهای هوشمند و تلفنهای همراه رواج یافته است. استفاده از واژهیابی گفتار در این دستگاهها با محدودیتهای حافظهای و پردازشی همراه است. از این رو، لازم است از روشهایی استفاده شود که در كنار دقت مطلوب، تعداد پارامترهای كمی نیز داشته باشد. در سالهای اخیر، شرکت گوگل مبتنی بر مدهای مطرح شبکههای عصبی پیچشی مانند موبایل نت، تیسی رزنت، اینسپشن و اکسپشن در حوزهی واژهیابی گفتار به دقت مطلوبی دست یافته است. در این مقاله سعی شده است با بهرهگیری از مکانیزم خودتوجه، دقت واژهیابی گفتار مبتنی بر مدلهای مطرح مذکور افزایش یابد. نتایج ارزیابی حاکی از آن است که استفاده از مکانیزم خودتوجه باعث افزایش دقت %1.72ای مدل موبایلنت، %1.411ای مدل اینسپشن، %1.43ای مدل اكسپشن و %1.83ای مدل تیسیرزنت بدون تاثیر قابل توجه بر تعداد پارامترهای آموزش پذیر مدلهای مذکور شده است. همچنین، در قیاس با سایر مدلهای مطرح در حوزهی واژهیابی گفتار، در بهترین حالت، به ازای کاهش حدود 2 درصد دقت، تعداد پارامترهای آموزش پذیر مدل 1000 برابر کاهش یافتهاند. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|