فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

شبکه تجمیع عصبی بازسازی کننده تشخیص چهره در ویدئو

نویسنده (ها)
  • زهرا طالبی
  • احمد نیک آبادی
مربوط به کنفرانس بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران
چکیده در این مقاله به ارائه شبکه تجمیع عصبی بازسازی کننده (RNAN: Regenerative Neural Aggregation Network) پرداخته می‌شود. این شبکه دنباله‌ای با تعداد متغییر از فریم‌های چهره در ویدئو را به عنوان ورودی دریافت کرده و بعد از ترمیم و بازسازی فریم‌ها یک بازنمایی فشرده با ابعاد ثابت از ویژگی فریم‌ها را تولید می‌کند. شبکه RNAN پیشنهادی دارای سه بخش اصلی است. بخش اول شبکه، فریم‌ها را دریافت می‌کند و با استفاده از شبکه مولد تقابلی به بازسازی چهره یا ترمیم کیفیت فریم‌های با کیفیت پایین می‌پردازد. بخش دوم شبکه، یک شبکه باقیمانده‌ای (ResNet) است که برای استخراج ویژگی از فریم‌ها استفاده می‌شود. در نهایت بخش سوم، تعدادی ویژگی استخراج شده از فریم‌ها را دریافت کرده و یک بردار واحد تجمیع شده را به عنوان خروجی تولید می‌کند. این خروجی در تایید هویت و بازشناسی چهره در ویدئو استفاده می‌شود. کارایی دو بخش انتهایی شبکه بر روی مجموعه داده IJB-A مقایسه شده و نتایج نهایی بر روی مجموعه داده ارائه شده TV-Dataset بیان می‌شود. نتایج نشان می‌دهند که شبکه RNAN به صورت قابل مشاهده‌ای نسبت به شبکه‌های تجمیع ساده بهتر عمل می‌کند.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله