مشاهده مشخصات مقاله
روشی سریع برای کاوش قوانین انجمنی در مجموعه داده های حجیم با استفاده از عملگر های منطقی
Authors |
-
س.م. فخر احمد
-
م.ه. صدرالدینی
-
م. ذوالقدری جهرمی
|
Conference |
دوازدهمین کنفرانس بینالمللی سالانه انجمن کامپیوتر ایران |
Abstract |
با توجه به کاربرد روزافزون بانکهای اطلاعاتی حجیم و انبارههای بزرگ تراکنش، اخیرا توجه بسیاری از محققان به سمت تولید روشهای کارآمد جهت استخراج قوانین انجمنی معطوف گشته است. اغلب روشهای موجود در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در دادهها جستجو میکنند که این امر نیازمند به خواندن مکرر کل دادهها از دیسک است. اکثر روشهایی هم که جدیدا پیشنهاد شدهاند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبانی 3 بعضی از اقلام را بتوان مستقیما و بدون پیمایش دادهها محاسبه کرد. اما به این مسأله کمتر توجه شده که چگونه به روش بهینهای برای شمارش دفعات رخداد اقلام در مواقعی که راهی جز شمارش وجود ندارد دست یابیم. در این مقاله راه حلی کارا برای این مسأله ارائه شده است. در روش پیشنهادی ما، دادهها تنها یک بار از دیسک خوانده میشوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل میگردند، بطوریکه اولا قابل نگهداری در حافظه میباشند و ثانیا با توجه به ساختار خاصی که دارند، عملیات شمارش به سریعترین نحو ممکن انجام میگردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل میشود. پس از ارائه الگوریتم، کارایی آن را با استفاده از دو مجموعه از دادههای ساختگی و واقعی ارزیابی کرده و با چند روش کارا که تاکنون ارائه شدهاند، مقایسه میکنیم.
|
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|