مشاهده مشخصات مقاله
یادگیري رفتار در ساختار رفتاري توسط یادگیري تقویتی
نویسنده (ها) |
-
علی اکبر آقامحمدي
-
مجید نیلی احمد آبادي
-
طاهر شهبازي میرزاحسنلو
|
مربوط به کنفرانس |
دوازدهمین کنفرانس بینالمللی سالانه انجمن کامپیوتر ایران |
چکیده |
مشکل عمده رو شهاي یادگیري مبتنی بر یادگیري تقویتی ، طولانی شدن زمان یادگیري در اثر افزایش ابعاد فضاي مسئله است .
یادگیري تقویتی سلسله مر اتبی با تجزیه مسئله به اجزاي کوچ کتر سعی در حل چنین مشکلی دار د. در این مقاله نیز با تجزیه مسئله به اجزاي کوچک تر که آنها را رفتار می نامیم، از ساختارهاي BB به عنوان ساختارهاي سلسله مراتبی براي یادگیري رفتارها استفاده می شود و روشی براي تجدید توابع ارزش و تقسیم پاداش دریافتی پیشنهاد می شو د. در این روش دانش طراح بیشتر در
ساختار کد می شود و مزایایی مانند سرعت بالاي همگرایی، روش هاي یادگیري سلسله مراتبی و کاهش فضاي حالت را با مزایاي سیستمهاي BB یکجا جمع می کنیم . به علاوه در چنین ساختاري قابلیت یادگیري خود ساخ تار نیز امکان پذیر است. نتایج شبیه سازي روي مسئله هدایت تاکسی، کارایی روش را بهتر نشان می دهد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|