فا   |   En
Login
مشاهده‌ مشخصات مقاله

تشخیص نظرات هرز در زبان فارسی با استفاده از یادگیری عمیق

Authors
  • محمود علی عرب
  • کاظم فولادی قلعه
Conference بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران
Abstract نظرات هرز به نظراتی گفته می‌شود که به قصد تبلیغ و یا تخریب یک محصول و یا برند نوشته می‌شوند. این نظرات باعث گمراهی افراد در خرید می‌شوند و تصمیم‌گیری آگاهانه را دشوار می‌سازند. تحقیقات زیادی برای تشخیص این نوع نظرات در زبان فارسی صورت نگرفته و تحقیقات موجود نیز از روش‌های یادگیری ماشین کلاسیک استفاده کرده‌اند. در این تحقیق مدلی ترکیبی با استفاده از 4 شبکه حافظه طولانی کوتاه مدت دو طرفه (BiLSTM) ارائه شده است که با استفاده از ویژگی‌های متن نظر و قطبیت نظرات آموزش می بیند. با توجه به عدم وجود قطبیت نظرات در برخی مجموعه داده‌ها، از یک مدل تحلیل احساسات برای استخراج قطبیت نظرات از روی متن آن‌ها، استفاده شده است. با توجه به اینکه مدل ارائه شده، برای یادگیری تنها به متن نظر نیاز دارد و از فراداده ها استفاده نمی کند، نظرات هرز تکی (نظراتی که نویسنده‌ی آن‌ها تنها یک نظر نوشته است) نیز با استفاده از این مدل قابل تشخیص هستند. عملکرد مدل ارائه شده در مقایسه با روش‌های موجود افزایش چشمگیری داشته است؛ به گونه‌ای که بر روی مجموعه داده Digikala که پرکاربردترین مجموعه داده‌ی زبان فارسی در این حوزه است، دقت 87.7 به دست آمد.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله