مشاهده مشخصات مقاله
ترکیب یادگیری با ناظر با یادگیری تقویتی برای ناوبری ربات
نویسنده (ها) |
|
مربوط به کنفرانس |
هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
این مقاله به طراحی کنترلگر برای مسأله ناوبری ربات می¬پردازد. در ناوبری ربات معمولاً مدل کاملی از محیط در دسترس نیست، لذا فرمان کنترلی با توجه به داده¬های محلی جمع آوری شده توسط حسگرهای ربات تولید می¬شود. استفاده از یادگیری با ناظر برای تنظیم کنترلگر دارای چالش¬های جدّی همچون ناسازگاری داده¬ها و خطای زیاد آن¬ها می¬باشد. لذا با توجه به قابلیت¬های روش یادگیری تقویتی که در آن تنها با استفاده از یک سیگنال تقویتی اسکالر آموزش صورت می¬گیرد، محققین از آن برای ناوبری ربات استفاده کرده¬اند. این مقاله یک ایده جدید جهت ترکیب یادگیری باناظر و یادگیری تقویتی برای تسريع در روند فرايند يادگيري ربات¬ها و بهبود کيفيت آموزش ارائه می¬دهد.
در فاز اول داده¬های آموزشی توسط ناظر در محیط جمع¬آوری می¬شوند و با کمک این داده¬ها و استفاده از روش یادگیری باناظر یک کنترلگر مرتبه صفر را تنظیم نموده¬ایم. بعد از این در فاز دوم پارامترهای تالی کنترلگر را با استفاده از روش یادگیری سارسای فازی (FSL) که یک الگوریتم یادگیری تقویتی فازی با معماری نقاد-تنها است تنظیم نموده¬ایم. محيط¬هاي آموزش و تست در شبيه ساز KIKS فراهم شده است. نتايج شبيه سازي حاكي از عملكرد مناسب روش یادگیری ترکیبی در مقایسه با یادگیری باناظر و FSL می¬باشد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|