فا | En

مشاهده‌ مشخصات مقاله

ترکیب یادگیری با ناظر با یادگیری تقویتی برای ناوبری ربات

Authors	فاطمه فتحی‌نژاد
Conference	هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫
Abstract	این مقاله به طراحی کنترلگر برای مسأله ناوبری ربات می¬پردازد. در ناوبری ربات معمولاً مدل کاملی از محیط در دسترس نیست، لذا فرمان کنترلی با توجه به داده¬های محلی جمع آوری شده توسط حسگرهای ربات تولید می¬شود. استفاده از یادگیری با ناظر برای تنظیم کنترلگر دارای چالش¬های جدّی همچون ناسازگاری داده¬ها و خطای زیاد آن¬ها می¬باشد. لذا با توجه به قابلیت¬های روش یادگیری تقویتی که در آن تنها با استفاده از یک سیگنال تقویتی اسکالر آموزش صورت می¬گیرد، محققین از آن برای ناوبری ربات استفاده کرده¬اند. این مقاله یک ایده جدید جهت ترکیب یادگیری باناظر و یادگیری تقویتی برای تسريع در روند فرايند يادگيري ربات¬ها و بهبود کيفيت آموزش ارائه می¬دهد. در فاز اول داده¬های آموزشی توسط ناظر در محیط جمع¬آوری می¬شوند و با کمک این داده¬ها و استفاده از روش یادگیری باناظر یک کنترلگر مرتبه صفر را تنظیم نموده¬ایم. بعد از این در فاز دوم پارامترهای تالی کنترلگر را با استفاده از روش یادگیری سارسای فازی (FSL) که یک الگوریتم یادگیری تقویتی فازی با معماری نقاد-تنها است تنظیم نموده¬ایم. محيط¬هاي آموزش و تست در شبيه ساز KIKS فراهم شده است. نتايج شبيه سازي حاكي از عملكرد مناسب روش یادگیری ترکیبی در مقایسه با یادگیری باناظر و FSL می¬باشد.
قیمت	برای اعضای سایت : 100,000 Rial برای دانشجویان عضو انجمن : 20,000 Rial برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله

Conferences and Events

Conference Archives

Registration in Computer Society of Iran

All rights reserved by the Computer Society of Iran