فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

الگوكاوي در پايگاه هاي تراكنش با ابعاد بالا بر اساس رويكرد شمارش از پايين به بالاي ماتريس بيتي

نویسنده (ها)
  • محمد كريم سهرابي
  • احمد عبدالله زاده بارفروش
مربوط به کنفرانس چهاردهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده كاوش داده هايي مانند ميكروآرايه ها كه ابعاد بس يار بالا يي دارند، باعث به وجود آمدن مشكلات جد ي بر اي اكثر الگور يتم ه اي كارآمد الگوكاوي موجود مي گردد و كارآ يي آنها را با چالش جد ي مواجه مي نمايد. در سالهاي اخير متدهاي جديدي ارائه شده كه مبتني بر شمارش سطرها هستند و با انجام يك جستجوي از پايين به بالا بر روي فضاي تركيب سطرها سعي در الگوكاوي كارآمد دارند كه با توجه به تعداد اندك سطرها در داده هاي ميكروآرايه اي، اين روش ها بس يار كارآمدتر از روش هاي مبتني بر شمارش ستون ها هستند. اما رويكرد از پايين به بالاي اين روش ها از يك سو و عدم امكان فشرده سازي مناسب اطلاعات از سوي ديگر سبب شده است كه روش هاي مزبور فاقد كارآيي كافي به منظور هرس نمودن فضاي جس تجو با توجه به مقدار حد آستانه مشخص شده توسط كاربر باشند و اين مساله منجر به طولاني شدن زمان اجرا و ايجاد فضاي سربار در حافظه مي گردد. در اين مقاله روش جستجوي جديدي به صورت كاوش از بالابه پا يين مبتني بر نمايش بيتي تراكنش ها بر روي ي ك درخت شمارش سطر ارائه مي گردد كه امكان استفاده كامل از قدرت هرس كردن توسط حد آستانه اي داده شده توسط كاربر را فراهم مي نمايد و به كوچك شدن شگفت انگيز فضاي جستجو مي انجامد . با استفاده از ا ين استراتژ ي جستجو، الگوريتم كاوشي به نام Clobimat طراحي شده است كه قادر به يافتن مجموعه كامل همه الگوه اي تكرارشونده بسته در مجموعه داده هاي با ابعاد بسيار بالاست. به علاوه روش جديدي براي تست بسته بودن الگوها ارائه شده است كه مانع از پويش چندين باره مجموعه داده مي گردد. مطالعات انجام شده نشان داده است كه الگوريتم ارائه شده در اين مقاله به لحاظ كارآيي برتري قابل ملاحظه اي نسبت به الگور يتم Carpenter كه يك الگور يتم جستجوي پايين به بالا ي فضاي سطرهاست- و الگوريتم FPClose كه يك الگوريتم مبتني بر جستجوي ستون هاست- دارد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله