فا   |   En
Login
مشاهده‌ مشخصات مقاله

تشخیص صفحات وب فریب‌آمیز فارسی زبان با تمرکز بر ویژگی‌های ظاهری، محتوایی و پیوند

Authors
  • شهره دلداری
  • مهسا شفاعی
  • شهرام خدیوی
Conference هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract از معضلات صفحه¬های فارسی موجود در وب می¬توان به حجم کثیر صفحات فریب¬آمیز و نیز صفحه¬ها با محتویات جعلی اشاره کرد. این¬گونه صفحات سعی دارند با ترفند¬های متفاوت موتور¬های جستجو را فریب داده و نتیجه جستجو را تحت تاثیر خود قرار دهند. در مقابل کاوشگر¬های وب به صورت مداوم روش¬های جدید تشخیص صفحات فریب¬آمیز را به کار می¬برند. طبق تحقیقات ما، در زمینه تشخیص اینگونه صفحات در زبان فارسی کار گسترده¬ای صورت نگرفته است. در این پژوهش ویژگی¬هایی منحصر به صفحات فارسی ارائه خواهیم داد که مبتنی بر ظاهر صفحه می¬باشد. در این مقاله مقدار این ویژگی¬ها برای تعدادی از سایت¬های فریب¬آمیز و مجاز زیان فارسی به دست¬آمده و در انتها با اعمال روش¬های مختلف ساخت مدل از قبیل درخت تصمیم¬گیری اطمینان حاصل شد ویژگی¬های انتخاب شده به خوبی و با دقت 96.7% قادر است در مجموعه¬ی داده¬ی موجود، صفحات فریب¬آمیز را متمایز سازد.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله