مشاهده مشخصات مقاله
شبکه تجمیع عصبی بازسازی کننده تشخیص چهره در ویدئو
نویسنده (ها) |
-
زهرا طالبی
-
احمد نیک آبادی
|
مربوط به کنفرانس |
بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران |
چکیده |
در این مقاله به ارائه شبکه تجمیع عصبی بازسازی کننده (RNAN: Regenerative Neural Aggregation Network) پرداخته میشود. این شبکه دنبالهای با تعداد متغییر از فریمهای چهره در ویدئو را به عنوان ورودی دریافت کرده و بعد از ترمیم و بازسازی فریمها یک بازنمایی فشرده با ابعاد ثابت از ویژگی فریمها را تولید میکند. شبکه RNAN پیشنهادی دارای سه بخش اصلی است. بخش اول شبکه، فریمها را دریافت میکند و با استفاده از شبکه مولد تقابلی به بازسازی چهره یا ترمیم کیفیت فریمهای با کیفیت پایین میپردازد. بخش دوم شبکه، یک شبکه باقیماندهای (ResNet) است که برای استخراج ویژگی از فریمها استفاده میشود. در نهایت بخش سوم، تعدادی ویژگی استخراج شده از فریمها را دریافت کرده و یک بردار واحد تجمیع شده را به عنوان خروجی تولید میکند. این خروجی در تایید هویت و بازشناسی چهره در ویدئو استفاده میشود. کارایی دو بخش انتهایی شبکه بر روی مجموعه داده IJB-A مقایسه شده و نتایج نهایی بر روی مجموعه داده ارائه شده TV-Dataset بیان میشود. نتایج نشان میدهند که شبکه RNAN به صورت قابل مشاهدهای نسبت به شبکههای تجمیع ساده بهتر عمل میکند. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|