فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

تشخیص نظرات هرز در زبان فارسی با استفاده از یادگیری عمیق

نویسنده (ها)
  • محمود علی عرب
  • کاظم فولادی قلعه
مربوط به کنفرانس بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران
چکیده نظرات هرز به نظراتی گفته می‌شود که به قصد تبلیغ و یا تخریب یک محصول و یا برند نوشته می‌شوند. این نظرات باعث گمراهی افراد در خرید می‌شوند و تصمیم‌گیری آگاهانه را دشوار می‌سازند. تحقیقات زیادی برای تشخیص این نوع نظرات در زبان فارسی صورت نگرفته و تحقیقات موجود نیز از روش‌های یادگیری ماشین کلاسیک استفاده کرده‌اند. در این تحقیق مدلی ترکیبی با استفاده از 4 شبکه حافظه طولانی کوتاه مدت دو طرفه (BiLSTM) ارائه شده است که با استفاده از ویژگی‌های متن نظر و قطبیت نظرات آموزش می بیند. با توجه به عدم وجود قطبیت نظرات در برخی مجموعه داده‌ها، از یک مدل تحلیل احساسات برای استخراج قطبیت نظرات از روی متن آن‌ها، استفاده شده است. با توجه به اینکه مدل ارائه شده، برای یادگیری تنها به متن نظر نیاز دارد و از فراداده ها استفاده نمی کند، نظرات هرز تکی (نظراتی که نویسنده‌ی آن‌ها تنها یک نظر نوشته است) نیز با استفاده از این مدل قابل تشخیص هستند. عملکرد مدل ارائه شده در مقایسه با روش‌های موجود افزایش چشمگیری داشته است؛ به گونه‌ای که بر روی مجموعه داده Digikala که پرکاربردترین مجموعه داده‌ی زبان فارسی در این حوزه است، دقت 87.7 به دست آمد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله