فا   |   En
Login

شناسائی عملی کلیک‌های هرز در وب با استفاده از الگوریتم‌های دسته‌بندی

Author: مهدیه فلاح و سجاد ظریف‌زاده

امروزه اکثر سرویس‌های اینترنتی از بازخورد کاربران برای بهبود کیفیت سرویس‌دهی به آنان استفاده می‌نمایند. به عنوان مثال، موتورهای جستجو از اطلاعات کلیک کاربران به عنوان یک فاکتور مهم در فرآیند رتبه‌بندی نتایج جستجو بهره می‌برند. از همین‌رو، برخی وب‌ سایت‌ها برای کسب رتبه بالاتر در بین مجموعه نتایج جستجو به انجام کلیک بر روی نتایج خود می‌پردازند. چون این کلیک‌ها توسط کاربران واقعی انجام نگرفته، اصطلاحاً به آنها کلیک‌های هرز گفته می‌شود. برای این منظور، وب سایت‌ها معمولاً از برنامه‌های نرم‌افزاری به نام "ربات‌ها" استفاده می‌کنند تا به صورت خودکار و توزیع‌شده به انجام این کار بپردازند. در این مقاله، روش‌ جدیدی مبتنی بر دسته‌بندی نشست‌های کاربران جهت شناسائی کلیک‌های هرز به صورت سریع و کارآمد پیشنهاد می‌شود. ما در ابتدا نشست‌های کاربران را به صورت مجموعه‌ای از ویژگی‌ها مدل می‌کنیم و سپس با اعمال الگوریتم‌ دسته‌بندی پیشنهادی، اقدام به شناسائی نشست‌های غیر نرمال و در نتیجه کلیک‌های هرز می‌نماییم. روش‌ مطرح شده با لاگ واقعی یک موتور جستجوی فارسی مورد تحلیل قرار گرفته است. نتایج بررسی‌ها نشان می‌دهد که روش‌ پیشنهادی می‌تواند کلیک‌های هرز را با دقتی بیش از 96% تشخیص دهد که در مقایسه با کارهای قبلی در حدود 5 درصد بهبود از خود نشان می‌دهد.

فایل مقاله