انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

ترکیب یادگیری با ناظر با یادگیری تقویتی برای ناوبری ربات

فاطمه فتحی‌نژاد

نویسنده (ها)

هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫

مربوط به کنفرانس

این مقاله به طراحی کنترلگر برای مسأله ناوبری ربات می¬پردازد. در ناوبری ربات معمولاً مدل کاملی از محیط در دسترس نیست، لذا فرمان کنترلی با توجه به داده¬های محلی جمع آوری شده توسط حسگرهای ربات تولید می¬شود. استفاده از یادگیری با ناظر برای تنظیم کنترلگر دارای چالش¬های جدّی همچون ناسازگاری داده¬ها و خطای زیاد آن¬ها می¬باشد. لذا با توجه به قابلیت¬های روش یادگیری تقویتی که در آن تنها با استفاده از یک سیگنال تقویتی اسکالر آموزش صورت می¬گیرد، محققین از آن برای ناوبری ربات استفاده کرده¬اند. این مقاله یک ایده جدید جهت ترکیب یادگیری باناظر و یادگیری تقویتی برای تسريع در روند فرايند يادگيري ربات¬ها و بهبود کيفيت آموزش ارائه می¬دهد. در فاز اول داده¬های آموزشی توسط ناظر در محیط جمع¬آوری می¬شوند و با کمک این داده¬ها و استفاده از روش یادگیری باناظر یک کنترلگر مرتبه صفر را تنظیم نموده¬ایم. بعد از این در فاز دوم پارامترهای تالی کنترلگر را با استفاده از روش یادگیری سارسای فازی (FSL) که یک الگوریتم یادگیری تقویتی فازی با معماری نقاد-تنها است تنظیم نموده¬ایم. محيط¬هاي آموزش و تست در شبيه ساز KIKS فراهم شده است. نتايج شبيه سازي حاكي از عملكرد مناسب روش یادگیری ترکیبی در مقایسه با یادگیری باناظر و FSL می¬باشد.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت