انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

تشخیص نظرات هرز در زبان فارسی با استفاده از یادگیری عمیق

محمود علی عرب, کاظم فولادی قلعه

نویسنده (ها)

بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران

مربوط به کنفرانس

نظرات هرز به نظراتی گفته می‌شود که به قصد تبلیغ و یا تخریب یک محصول و یا برند نوشته می‌شوند. این نظرات باعث گمراهی افراد در خرید می‌شوند و تصمیم‌گیری آگاهانه را دشوار می‌سازند. تحقیقات زیادی برای تشخیص این نوع نظرات در زبان فارسی صورت نگرفته و تحقیقات موجود نیز از روش‌های یادگیری ماشین کلاسیک استفاده کرده‌اند. در این تحقیق مدلی ترکیبی با استفاده از 4 شبکه حافظه طولانی کوتاه مدت دو طرفه (BiLSTM) ارائه شده است که با استفاده از ویژگی‌های متن نظر و قطبیت نظرات آموزش می بیند. با توجه به عدم وجود قطبیت نظرات در برخی مجموعه داده‌ها، از یک مدل تحلیل احساسات برای استخراج قطبیت نظرات از روی متن آن‌ها، استفاده شده است. با توجه به اینکه مدل ارائه شده، برای یادگیری تنها به متن نظر نیاز دارد و از فراداده ها استفاده نمی کند، نظرات هرز تکی (نظراتی که نویسنده‌ی آن‌ها تنها یک نظر نوشته است) نیز با استفاده از این مدل قابل تشخیص هستند. عملکرد مدل ارائه شده در مقایسه با روش‌های موجود افزایش چشمگیری داشته است؛ به گونه‌ای که بر روی مجموعه داده Digikala که پرکاربردترین مجموعه داده‌ی زبان فارسی در این حوزه است، دقت 87.7 به دست آمد.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت