مشاهده مشخصات مقاله
تشخیص نظرات هرز در زبان فارسی با استفاده از یادگیری عمیق
Authors |
-
محمود علی عرب
-
کاظم فولادی قلعه
|
Conference |
بیست و هفتمین کنفرانس بین الملی انجمن کامپیوتر ایران |
Abstract |
نظرات هرز به نظراتی گفته میشود که به قصد تبلیغ و یا تخریب یک محصول و یا برند نوشته میشوند. این نظرات باعث گمراهی افراد در خرید میشوند و تصمیمگیری آگاهانه را دشوار میسازند. تحقیقات زیادی برای تشخیص این نوع نظرات در زبان فارسی صورت نگرفته و تحقیقات موجود نیز از روشهای یادگیری ماشین کلاسیک استفاده کردهاند. در این تحقیق مدلی ترکیبی با استفاده از 4 شبکه حافظه طولانی کوتاه مدت دو طرفه (BiLSTM) ارائه شده است که با استفاده از ویژگیهای متن نظر و قطبیت نظرات آموزش می بیند. با توجه به عدم وجود قطبیت نظرات در برخی مجموعه دادهها، از یک مدل تحلیل احساسات برای استخراج قطبیت نظرات از روی متن آنها، استفاده شده است. با توجه به اینکه مدل ارائه شده، برای یادگیری تنها به متن نظر نیاز دارد و از فراداده ها استفاده نمی کند، نظرات هرز تکی (نظراتی که نویسندهی آنها تنها یک نظر نوشته است) نیز با استفاده از این مدل قابل تشخیص هستند. عملکرد مدل ارائه شده در مقایسه با روشهای موجود افزایش چشمگیری داشته است؛ به گونهای که بر روی مجموعه داده Digikala که پرکاربردترین مجموعه دادهی زبان فارسی در این حوزه است، دقت 87.7 به دست آمد. |
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|