تشخیص صفحات وب فریب‌آمیز فارسی زبان با تمرکز بر ویژگی‌های ظاهری، محتوایی و پیوند

مشاهده‌ مشخصات مقاله

تشخیص صفحات وب فریب‌آمیز فارسی زبان با تمرکز بر ویژگی‌های ظاهری، محتوایی و پیوند

شهره دلداری, مهسا شفاعی, شهرام خدیوی

نویسنده (ها)

هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران

مربوط به کنفرانس

از معضلات صفحه¬های فارسی موجود در وب می¬توان به حجم کثیر صفحات فریب¬آمیز و نیز صفحه¬ها با محتویات جعلی اشاره کرد. این¬گونه صفحات سعی دارند با ترفند¬های متفاوت موتور¬های جستجو را فریب داده و نتیجه جستجو را تحت تاثیر خود قرار دهند. در مقابل کاوشگر¬های وب به صورت مداوم روش¬های جدید تشخیص صفحات فریب¬آمیز را به کار می¬برند. طبق تحقیقات ما، در زمینه تشخیص اینگونه صفحات در زبان فارسی کار گسترده¬ای صورت نگرفته است. در این پژوهش ویژگی¬هایی منحصر به صفحات فارسی ارائه خواهیم داد که مبتنی بر ظاهر صفحه می¬باشد. در این مقاله مقدار این ویژگی¬ها برای تعدادی از سایت¬های فریب¬آمیز و مجاز زیان فارسی به دست¬آمده و در انتها با اعمال روش¬های مختلف ساخت مدل از قبیل درخت تصمیم¬گیری اطمینان حاصل شد ویژگی¬های انتخاب شده به خوبی و با دقت 96.7% قادر است در مجموعه¬ی داده¬ی موجود، صفحات فریب¬آمیز را متمایز سازد.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت

خرید مقاله