فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

واژه‌یابی گفتار مبتنی بر مدل‌های مطرح شبكه‌های عصبی پیچشی به كمك مكانیزم خود توجه

نویسنده (ها)
  • بهنام اوجاقی
  • شیما طبیبیان
مربوط به کنفرانس بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران
چکیده واژه‌یابی گفتار به جستجوی کلمات كلیدی هدف در یک آرشیو صوتی اتلاق می‌شود. در سال‌های اخیر با پیشرفت تکنولوژی استفاده از سیستم‌های واژه‌یاب گفتار در دستگاه‌های با توان پردازشی كم مانند بلندگوهای هوشمند و تلفن‌های همراه رواج یافته است. استفاده از واژه‌یابی گفتار در این دستگاه‌ها با محدودیت‌های حافظه‌ای و پردازشی همراه است. از این رو، لازم است از روش‌هایی استفاده شود که در كنار دقت مطلوب، تعداد پارامتر‌های كمی نیز داشته باشد. در سال‌های اخیر، شرکت گوگل مبتنی بر مد‌های مطرح شبکه‌های عصبی پیچشی مانند موبایل نت، تی‌سی رزنت، اینسپشن و اکسپشن در حوزه‌ی واژه‌یابی گفتار به دقت مطلوبی دست یافته است. در این مقاله سعی شده است با بهره‌گیری از مکانیزم خودتوجه، دقت واژه‌یابی گفتار مبتنی بر مدل‌های مطرح مذکور افزایش یابد. نتایج ارزیابی حاکی از آن است که استفاده از مکانیزم خودتوجه باعث افزایش دقت %1.72ای مدل موبایل‌نت، %1.411ای مدل اینسپشن، %1.43ای مدل اكسپشن و %1.83ای مدل تی‌سی‌رزنت بدون تاثیر قابل توجه بر تعداد پارامترهای آموزش پذیر مدل‌های مذکور شده است. همچنین، در قیاس با سایر مدل‌های مطرح در حوزه‌ی واژه‌یابی گفتار، در بهترین حالت، به ازای کاهش حدود 2 درصد دقت، تعداد پارامترهای آموزش پذیر مدل 1000 برابر کاهش یافته‌اند.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله