مشاهده مشخصات مقاله
شهره دلداری, مهسا شفاعی, شهرام خدیوی
هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
از معضلات صفحه¬های فارسی موجود در وب می¬توان به حجم کثیر صفحات فریب¬آمیز و نیز صفحه¬ها با محتویات جعلی اشاره کرد. این¬گونه صفحات سعی دارند با ترفند¬های متفاوت موتور¬های جستجو را فریب داده و نتیجه جستجو را تحت تاثیر خود قرار دهند. در مقابل کاوشگر¬های وب به صورت مداوم روش¬های جدید تشخیص صفحات فریب¬آمیز را به کار می¬برند. طبق تحقیقات ما، در زمینه تشخیص اینگونه صفحات در زبان فارسی کار گسترده¬ای صورت نگرفته است. در این پژوهش ویژگی¬هایی منحصر به صفحات فارسی ارائه خواهیم داد که مبتنی بر ظاهر صفحه می¬باشد. در این مقاله مقدار این ویژگی¬ها برای تعدادی از سایت¬های فریب¬آمیز و مجاز زیان فارسی به دست¬آمده و در انتها با اعمال روش¬های مختلف ساخت مدل از قبیل درخت تصمیم¬گیری اطمینان حاصل شد ویژگی¬های انتخاب شده به خوبی و با دقت 96.7% قادر است در مجموعه¬ی داده¬ی موجود، صفحات فریب¬آمیز را متمایز سازد.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال