مشاهده مشخصات مقاله
ارائه يک روش بهبوديافته براي پرسش و پاسخ بصري با استفاده از واحد بازگشتي دروازهاي و جستجوي محلي
نویسنده (ها) |
-
نفیسه ایزدیار
-
احمد نیک ابادی
|
مربوط به کنفرانس |
بیست و چهارمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
هدف سامانه هاي پرسش و پاسخ بصري دريافت يک تصوير و يک سوال مرتبط با آن تصوير و ايجاد پاسخ مناسب براي سوال است. در اغلب روشهاي فعلي، ويژگيهاي تصوير و سوال به ترتيب با استفاده از شبکههاي عصبي کانولوشني و حافظه کوتاه مدت طولاني استخراج شده و پس از ترکيب با هم، پاسخ نهايي توليد ميشود. اين روشها در عمل توانايي استنتاج بر روي تصوير را ندارند و تنها دانش موجود در مجموعه داده آموزشي را مدل ميکنند. به همين منظور، معماريهاي ماژولار مبتني بر شبکه عصبي معرفي شد. اين معماري شامل دو بخش توليد برنامه و موتور اجرا است. بخش توليد برنامه، سوال ورودي را به يک برنامه که شامل مجموعههاي از توابع است، تبديل ميکند. اين توابع نحوه قرار گرفتن ماژولهاي شبکه عصبي لازم براي سوال ورودي را مشخص ميکنند. سپس در بخش موتور اجرا، ماژولها به ترتيبي که مشخص شده است، بر روي تصوير اجرا خواهند شد و در نهايت پاسخ نهايي توليد ميشود. در اين مقاله يک سامانه بهبوديافته پرسش و پاسخ بصري ارائه شده است که در آن از واحدهاي بازگشتي دروازهاي و جستجوي محلي به منظور کدگذاري بهتر سوال ورودي استفاده شد است. بررسيهاي انجام شده بر روي مجموعه داده CLEVR، بهبود سه درصدي در بخش کدگذاري پرسش را نسبت به روشهاي موجود نشان ميدهد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|