فا   |   En
Login
مشاهده‌ مشخصات مقاله

پالايش صفحات وب بر اساس تحليل هوشمند محتوا

Authors
  • علي احمدي
  • مهدي زمانيان
  • هادي فرزين
  • محمود خالقي
  • محسن محمدي تاكامي
Conference چهاردهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract روش هاي موجود براي پالايش صفحات وب بيشتر مبتني بر سد كردن نشاني هاي اينترنتي خاص از طريق جستجو در يك ليست مرجع از صفحات غير مجاز و يا با استفاده از تحليل ساده متن از طريق جستجوي كلمات كليدي خاص در صفحات است. مشكل اصلي اين روش ها نياز براي به روزرساني مداوم فهرست نشاني ها و نيز ميزان قابل توجه اشتباه گرفتن صفح ههاي مجاز در آنهاست. در اين مقاله يك روش پالايش هوشمند براي پالايش صفحات غيراخلاقي را پيشنهاد كرده ايم كه با استفاده از هر سه نوع ويژگي ساختاري، متني و تصويري و تركيب سلسله مراتبي آنها يك دسته بندي هوشمند با دقت بالا (روي FP و FN هر دو) را به دست مي دهد. الگوريتم روي 2600 صفحه وب شامل 1400 صفحه غيراخلاقي (داراي متن، تصوير، يا هر دو) انگليسي و فارسي و 1200 صفحه مجاز شامل صفحات پزشكي، سلامت، ورزشي و غيره مورد آزمايش قرار گرفته و دقت دسته بندي بالاي 95 % را به همراه داشته است.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله