فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

ترکیب یادگیری با ناظر با یادگیری تقویتی برای ناوبری ربات

نویسنده (ها)
  • فاطمه فتحی‌نژاد
مربوط به کنفرانس هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫
چکیده این مقاله به طراحی کنترلگر برای مسأله ناوبری ربات می¬پردازد. در ناوبری ربات معمولاً مدل کاملی از محیط در دسترس نیست، لذا فرمان کنترلی با توجه به داده¬های محلی جمع آوری شده توسط حسگرهای ربات تولید می¬شود. استفاده از یادگیری با ناظر برای تنظیم کنترلگر دارای چالش¬های جدّی همچون ناسازگاری داده¬ها و خطای زیاد آن¬ها می¬باشد. لذا با توجه به قابلیت¬های روش یادگیری تقویتی که در آن تنها با استفاده از یک سیگنال تقویتی اسکالر آموزش صورت می¬گیرد، محققین از آن برای ناوبری ربات استفاده کرده¬اند. این مقاله یک ایده جدید جهت ترکیب یادگیری باناظر و یادگیری تقویتی برای تسريع در روند فرايند يادگيري ربات¬ها و بهبود کيفيت آموزش ارائه می¬دهد. در فاز اول داده¬های آموزشی توسط ناظر در محیط جمع¬آوری می¬شوند و با کمک این داده¬ها و استفاده از روش یادگیری باناظر یک کنترلگر مرتبه صفر را تنظیم نموده¬ایم. بعد از این در فاز دوم پارامترهای تالی کنترلگر را با استفاده از روش یادگیری سارسای فازی (FSL) که یک الگوریتم یادگیری تقویتی فازی با معماری نقاد-تنها است تنظیم نموده¬ایم. محيط¬هاي آموزش و تست در شبيه ساز KIKS فراهم شده است. نتايج شبيه سازي حاكي از عملكرد مناسب روش یادگیری ترکیبی در مقایسه با یادگیری باناظر و FSL می¬باشد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله