فا   |   En
Login
مشاهده‌ مشخصات مقاله

شبکه تجمیع عصبی بازسازی کننده تشخیص چهره در ویدئو

Authors
  • زهرا طالبی
  • احمد نیک آبادی
Conference بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران
Abstract در این مقاله به ارائه شبکه تجمیع عصبی بازسازی کننده (RNAN: Regenerative Neural Aggregation Network) پرداخته می‌شود. این شبکه دنباله‌ای با تعداد متغییر از فریم‌های چهره در ویدئو را به عنوان ورودی دریافت کرده و بعد از ترمیم و بازسازی فریم‌ها یک بازنمایی فشرده با ابعاد ثابت از ویژگی فریم‌ها را تولید می‌کند. شبکه RNAN پیشنهادی دارای سه بخش اصلی است. بخش اول شبکه، فریم‌ها را دریافت می‌کند و با استفاده از شبکه مولد تقابلی به بازسازی چهره یا ترمیم کیفیت فریم‌های با کیفیت پایین می‌پردازد. بخش دوم شبکه، یک شبکه باقیمانده‌ای (ResNet) است که برای استخراج ویژگی از فریم‌ها استفاده می‌شود. در نهایت بخش سوم، تعدادی ویژگی استخراج شده از فریم‌ها را دریافت کرده و یک بردار واحد تجمیع شده را به عنوان خروجی تولید می‌کند. این خروجی در تایید هویت و بازشناسی چهره در ویدئو استفاده می‌شود. کارایی دو بخش انتهایی شبکه بر روی مجموعه داده IJB-A مقایسه شده و نتایج نهایی بر روی مجموعه داده ارائه شده TV-Dataset بیان می‌شود. نتایج نشان می‌دهند که شبکه RNAN به صورت قابل مشاهده‌ای نسبت به شبکه‌های تجمیع ساده بهتر عمل می‌کند.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله