شناسائی عملی کلیکهای هرز در وب با استفاده از الگوریتمهای دستهبندی
امروزه اکثر سرویسهای اینترنتی از بازخورد کاربران برای بهبود کیفیت سرویسدهی به آنان استفاده مینمایند. به عنوان مثال، موتورهای جستجو از اطلاعات کلیک کاربران به عنوان یک فاکتور مهم در فرآیند رتبهبندی نتایج جستجو بهره میبرند. از همینرو، برخی وب سایتها برای کسب رتبه بالاتر در بین مجموعه نتایج جستجو به انجام کلیک بر روی نتایج خود میپردازند. چون این کلیکها توسط کاربران واقعی انجام نگرفته، اصطلاحاً به آنها کلیکهای هرز گفته میشود. برای این منظور، وب سایتها معمولاً از برنامههای نرمافزاری به نام "رباتها" استفاده میکنند تا به صورت خودکار و توزیعشده به انجام این کار بپردازند. در این مقاله، روش جدیدی مبتنی بر دستهبندی نشستهای کاربران جهت شناسائی کلیکهای هرز به صورت سریع و کارآمد پیشنهاد میشود. ما در ابتدا نشستهای کاربران را به صورت مجموعهای از ویژگیها مدل میکنیم و سپس با اعمال الگوریتم دستهبندی پیشنهادی، اقدام به شناسائی نشستهای غیر نرمال و در نتیجه کلیکهای هرز مینماییم. روش مطرح شده با لاگ واقعی یک موتور جستجوی فارسی مورد تحلیل قرار گرفته است. نتایج بررسیها نشان میدهد که روش پیشنهادی میتواند کلیکهای هرز را با دقتی بیش از 96% تشخیص دهد که در مقایسه با کارهای قبلی در حدود 5 درصد بهبود از خود نشان میدهد.
|