فا   |   En
Login
مشاهده‌ مشخصات مقاله

واژه‌یابی گفتار مبتنی بر مدل‌های مطرح شبكه‌های عصبی پیچشی به كمك مكانیزم خود توجه

Authors
  • بهنام اوجاقی
  • شیما طبیبیان
Conference بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران
Abstract واژه‌یابی گفتار به جستجوی کلمات كلیدی هدف در یک آرشیو صوتی اتلاق می‌شود. در سال‌های اخیر با پیشرفت تکنولوژی استفاده از سیستم‌های واژه‌یاب گفتار در دستگاه‌های با توان پردازشی كم مانند بلندگوهای هوشمند و تلفن‌های همراه رواج یافته است. استفاده از واژه‌یابی گفتار در این دستگاه‌ها با محدودیت‌های حافظه‌ای و پردازشی همراه است. از این رو، لازم است از روش‌هایی استفاده شود که در كنار دقت مطلوب، تعداد پارامتر‌های كمی نیز داشته باشد. در سال‌های اخیر، شرکت گوگل مبتنی بر مد‌های مطرح شبکه‌های عصبی پیچشی مانند موبایل نت، تی‌سی رزنت، اینسپشن و اکسپشن در حوزه‌ی واژه‌یابی گفتار به دقت مطلوبی دست یافته است. در این مقاله سعی شده است با بهره‌گیری از مکانیزم خودتوجه، دقت واژه‌یابی گفتار مبتنی بر مدل‌های مطرح مذکور افزایش یابد. نتایج ارزیابی حاکی از آن است که استفاده از مکانیزم خودتوجه باعث افزایش دقت %1.72ای مدل موبایل‌نت، %1.411ای مدل اینسپشن، %1.43ای مدل اكسپشن و %1.83ای مدل تی‌سی‌رزنت بدون تاثیر قابل توجه بر تعداد پارامترهای آموزش پذیر مدل‌های مذکور شده است. همچنین، در قیاس با سایر مدل‌های مطرح در حوزه‌ی واژه‌یابی گفتار، در بهترین حالت، به ازای کاهش حدود 2 درصد دقت، تعداد پارامترهای آموزش پذیر مدل 1000 برابر کاهش یافته‌اند.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله