فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

ارائه يک روش بهبوديافته براي پرسش و پاسخ بصري با استفاده از واحد بازگشتي دروازه‏اي و جستجوي محلي

نویسنده (ها)
  • نفیسه ایزدیار
  • احمد نیک ابادی
مربوط به کنفرانس بیست و چهارمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده هدف سامانه‏ هاي پرسش و پاسخ بصري دريافت يک تصوير و يک سوال مرتبط با آن تصوير و ايجاد پاسخ مناسب براي سوال است. در اغلب روش‌‏هاي فعلي، ويژگي‏‌هاي تصوير و سوال به ترتيب با استفاده از شبکه‌‏هاي عصبي کانولوشني و حافظه کوتاه مدت طولاني استخراج شده و پس از ترکيب با هم، پاسخ نهايي توليد مي‏شود. اين روش‌‏ها در عمل توانايي استنتاج بر روي تصوير را ندارند و تنها دانش موجود در مجموعه داده آموزشي را مدل مي‏کنند. به همين منظور، معماري‏‌هاي ماژولار مبتني بر شبکه عصبي معرفي شد. اين معماري شامل دو بخش توليد برنامه و موتور اجرا است. بخش توليد برنامه، سوال ورودي را به يک برنامه که شامل مجموعه‏‌هاي از توابع است، تبديل مي‏کند. اين توابع نحوه قرار گرفتن ماژول‌‏هاي شبکه عصبي لازم براي سوال ورودي را مشخص مي‏کنند. سپس در بخش موتور اجرا، ماژول‏‌ها به ترتيبي که مشخص شده است، بر روي تصوير اجرا خواهند شد و در نهايت پاسخ نهايي توليد مي‏شود. در اين مقاله يک سامانه بهبوديافته پرسش و پاسخ بصري ارائه شده است که در آن از واحدهاي بازگشتي دروازه‏اي و جستجوي محلي به منظور کدگذاري بهتر سوال ورودي استفاده شد است. بررسي‏‌هاي انجام شده بر روي مجموعه داده CLEVR، بهبود سه درصدي در بخش کدگذاري پرسش را نسبت به روش‏‌هاي موجود نشان مي‏دهد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله