مشاهده مشخصات مقاله
تشخیص نظرات هرز در زبان فارسی با استفاده از یادگیری عمیق
نویسنده (ها) |
-
محمود علی عرب
-
کاظم فولادی قلعه
|
مربوط به کنفرانس |
بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران |
چکیده |
نظرات هرز به نظراتی گفته میشود که به قصد تبلیغ و یا تخریب یک محصول و یا برند نوشته میشوند. این نظرات باعث گمراهی افراد در خرید میشوند و تصمیمگیری آگاهانه را دشوار میسازند. تحقیقات زیادی برای تشخیص این نوع نظرات در زبان فارسی صورت نگرفته و تحقیقات موجود نیز از روشهای یادگیری ماشین کلاسیک استفاده کردهاند. در این تحقیق مدلی ترکیبی با استفاده از 4 شبکه حافظه طولانی کوتاه مدت دو طرفه (BiLSTM) ارائه شده است که با استفاده از ویژگیهای متن نظر و قطبیت نظرات آموزش می بیند. با توجه به عدم وجود قطبیت نظرات در برخی مجموعه دادهها، از یک مدل تحلیل احساسات برای استخراج قطبیت نظرات از روی متن آنها، استفاده شده است. با توجه به اینکه مدل ارائه شده، برای یادگیری تنها به متن نظر نیاز دارد و از فراداده ها استفاده نمی کند، نظرات هرز تکی (نظراتی که نویسندهی آنها تنها یک نظر نوشته است) نیز با استفاده از این مدل قابل تشخیص هستند. عملکرد مدل ارائه شده در مقایسه با روشهای موجود افزایش چشمگیری داشته است؛ به گونهای که بر روی مجموعه داده Digikala که پرکاربردترین مجموعه دادهی زبان فارسی در این حوزه است، دقت 87.7 به دست آمد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|