مشاهده مشخصات مقاله
پالايش صفحات وب بر اساس تحليل هوشمند محتوا
نویسنده (ها) |
-
علي احمدي
-
مهدي زمانيان
-
هادي فرزين
-
محمود خالقي
-
محسن محمدي تاكامي
|
مربوط به کنفرانس |
چهاردهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
روش هاي موجود براي پالايش صفحات وب بيشتر مبتني بر
سد كردن نشاني هاي اينترنتي خاص از طريق جستجو در يك ليست
مرجع از صفحات غير مجاز و يا با استفاده از تحليل ساده متن از طريق
جستجوي كلمات كليدي خاص در صفحات است. مشكل اصلي اين
روش ها نياز براي به روزرساني مداوم فهرست نشاني ها و نيز ميزان
قابل توجه اشتباه گرفتن صفح ههاي مجاز در آنهاست. در اين مقاله يك
روش پالايش هوشمند براي پالايش صفحات غيراخلاقي را پيشنهاد
كرده ايم كه با استفاده از هر سه نوع ويژگي ساختاري، متني و تصويري
و تركيب سلسله مراتبي آنها يك دسته بندي هوشمند با دقت بالا (روي FP و FN هر دو) را به دست مي دهد. الگوريتم روي 2600 صفحه وب شامل 1400 صفحه غيراخلاقي (داراي متن، تصوير، يا هر دو) انگليسي
و فارسي و 1200 صفحه مجاز شامل صفحات پزشكي، سلامت، ورزشي
و غيره مورد آزمايش قرار گرفته و دقت دسته بندي بالاي 95 % را به
همراه داشته است. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|