مشاهده مشخصات مقاله
زکیه شجاعی استبرق, محمد منصور ریاحی کاشانی, کامران لایقی
هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
امروزه مبحث تعامل انسان و رایانه یکی از علاقمندی¬های پژوهشی عمده در جامعه علمی شده است. این تعامل می¬تواند در قالب یک سیستم مکالمه گفتاری ظاهر شود که انسان¬ها را قادر می¬سازد تا با ماشین¬ها مکالمه گفتاری داشته باشند. پیشرفت¬های قابل توجه در سال¬های اخیر در طراحی و تولید سیستم¬های تشخیص گفتار، درک زبان طبیعی و تبدیل متن به گفتار برای زبان فارسی، راه را برای طراحی و ایجاد سیستم¬های مکالمه گفتاری فارسی و جایگزینی آنها با سیستم¬های سنتی تلفن گویا، گشوده است. واحد مدیریت مکالمه یک جزء مهم و اساسی و در واقع قلب سیستم¬های مکالمه گفتاری است. سیستم مدیریت مکالمه تحت یک استراتژی یا سیاست مکالمه رفتار می¬کند که وظیفه آن، انتخاب کنش¬های مناسب در هر حالت مکالمه است. به سبب ماهیت سخت طراحی استراتژی های مکالمه، چارچوب یادگیری تقویتی در سیستم¬های مکالمه گفتاری برای کشف سیاست بهینه با استفاده از یادگیری داده محور و خودکار، مطرح گردید. در این مقاله، الگوریتم¬های یادگیری تقویتی برای یادگیری واحد مدیریت مکالمه مورد بررسی قرار گرفته¬اند و مراحل طراحی و شبیه¬سازی یک سیستم مدیریت مکالمه نمونه شرح داده شده است. سپس در فاز یادگیری، سیستم طراحی شده با استفاده از الگوریتم یادگیری تقویتی مستقل از مدل منتخب Watkins’ Q(λ) و داده¬های آموزشی آنلاین شامل صد مکالمه مفروض، برای دو مقدار مختلف λ آموزش داده شده و به همگرایی رسیده است. تأثیر تغییر λ بر روی سرعت و دقت یادگیری، بررسی شده و الگوی تغییرات تابع ارزش عمل در طی فرآیند یادگیری بدست آمده است.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال