فا | En

ورود به سایت

صفحه اصلی

درباره ما

کنفرانس‌ها و رخدادها

کارگاه‌ها و سمینارها

سایت‌های مرتبط

پرداخت‌ها

مشاهده‌ مشخصات مقاله

ترکیب یادگیری با ناظر با یادگیری تقویتی برای ناوبری ربات

نویسنده (ها)	فاطمه فتحی‌نژاد
مربوط به کنفرانس	هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫
چکیده	این مقاله به طراحی کنترلگر برای مسأله ناوبری ربات می¬پردازد. در ناوبری ربات معمولاً مدل کاملی از محیط در دسترس نیست، لذا فرمان کنترلی با توجه به داده¬های محلی جمع آوری شده توسط حسگرهای ربات تولید می¬شود. استفاده از یادگیری با ناظر برای تنظیم کنترلگر دارای چالش¬های جدّی همچون ناسازگاری داده¬ها و خطای زیاد آن¬ها می¬باشد. لذا با توجه به قابلیت¬های روش یادگیری تقویتی که در آن تنها با استفاده از یک سیگنال تقویتی اسکالر آموزش صورت می¬گیرد، محققین از آن برای ناوبری ربات استفاده کرده¬اند. این مقاله یک ایده جدید جهت ترکیب یادگیری باناظر و یادگیری تقویتی برای تسريع در روند فرايند يادگيري ربات¬ها و بهبود کيفيت آموزش ارائه می¬دهد. در فاز اول داده¬های آموزشی توسط ناظر در محیط جمع¬آوری می¬شوند و با کمک این داده¬ها و استفاده از روش یادگیری باناظر یک کنترلگر مرتبه صفر را تنظیم نموده¬ایم. بعد از این در فاز دوم پارامترهای تالی کنترلگر را با استفاده از روش یادگیری سارسای فازی (FSL) که یک الگوریتم یادگیری تقویتی فازی با معماری نقاد-تنها است تنظیم نموده¬ایم. محيط¬هاي آموزش و تست در شبيه ساز KIKS فراهم شده است. نتايج شبيه سازي حاكي از عملكرد مناسب روش یادگیری ترکیبی در مقایسه با یادگیری باناظر و FSL می¬باشد.
قیمت	برای اعضای سایت : ۱٠٠,٠٠٠ ریال برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله

کنفرانس‌ها و رخدادها

آرشیو کنفرانس‌ها

آرشیو مقالات

رخدادهای مرتبط

عضویت در انجمن کامپیوتر ایران

تمام حقوق مادی و معنوی این سایت متعلق به انجمن کامپیوتر ایران می باشد و استفاده از مطالب با ذکر منبع بلامانع است.