انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

شبکه تجمیع عصبی بازسازی کننده تشخیص چهره در ویدئو

زهرا طالبی, احمد نیک آبادی

نویسنده (ها)

بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران

مربوط به کنفرانس

در این مقاله به ارائه شبکه تجمیع عصبی بازسازی کننده (RNAN: Regenerative Neural Aggregation Network) پرداخته می‌شود. این شبکه دنباله‌ای با تعداد متغییر از فریم‌های چهره در ویدئو را به عنوان ورودی دریافت کرده و بعد از ترمیم و بازسازی فریم‌ها یک بازنمایی فشرده با ابعاد ثابت از ویژگی فریم‌ها را تولید می‌کند. شبکه RNAN پیشنهادی دارای سه بخش اصلی است. بخش اول شبکه، فریم‌ها را دریافت می‌کند و با استفاده از شبکه مولد تقابلی به بازسازی چهره یا ترمیم کیفیت فریم‌های با کیفیت پایین می‌پردازد. بخش دوم شبکه، یک شبکه باقیمانده‌ای (ResNet) است که برای استخراج ویژگی از فریم‌ها استفاده می‌شود. در نهایت بخش سوم، تعدادی ویژگی استخراج شده از فریم‌ها را دریافت کرده و یک بردار واحد تجمیع شده را به عنوان خروجی تولید می‌کند. این خروجی در تایید هویت و بازشناسی چهره در ویدئو استفاده می‌شود. کارایی دو بخش انتهایی شبکه بر روی مجموعه داده IJB-A مقایسه شده و نتایج نهایی بر روی مجموعه داده ارائه شده TV-Dataset بیان می‌شود. نتایج نشان می‌دهند که شبکه RNAN به صورت قابل مشاهده‌ای نسبت به شبکه‌های تجمیع ساده بهتر عمل می‌کند.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت