مشاهده مشخصات مقاله
روشی سریع برای کاوش قوانین انجمنی در مجموعه داده های حجیم با استفاده از عملگر های منطقی
نویسنده (ها) |
-
س.م. فخر احمد
-
م.ه. صدرالدینی
-
م. ذوالقدری جهرمی
|
مربوط به کنفرانس |
دوازدهمین کنفرانس بینالمللی سالانه انجمن کامپیوتر ایران |
چکیده |
با توجه به کاربرد روزافزون بانکهای اطلاعاتی حجیم و انبارههای بزرگ تراکنش، اخیرا توجه بسیاری از محققان به سمت تولید روشهای کارآمد جهت استخراج قوانین انجمنی معطوف گشته است. اغلب روشهای موجود در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در دادهها جستجو میکنند که این امر نیازمند به خواندن مکرر کل دادهها از دیسک است. اکثر روشهایی هم که جدیدا پیشنهاد شدهاند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبانی 3 بعضی از اقلام را بتوان مستقیما و بدون پیمایش دادهها محاسبه کرد. اما به این مسأله کمتر توجه شده که چگونه به روش بهینهای برای شمارش دفعات رخداد اقلام در مواقعی که راهی جز شمارش وجود ندارد دست یابیم. در این مقاله راه حلی کارا برای این مسأله ارائه شده است. در روش پیشنهادی ما، دادهها تنها یک بار از دیسک خوانده میشوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل میگردند، بطوریکه اولا قابل نگهداری در حافظه میباشند و ثانیا با توجه به ساختار خاصی که دارند، عملیات شمارش به سریعترین نحو ممکن انجام میگردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل میشود. پس از ارائه الگوریتم، کارایی آن را با استفاده از دو مجموعه از دادههای ساختگی و واقعی ارزیابی کرده و با چند روش کارا که تاکنون ارائه شدهاند، مقایسه میکنیم.
|
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|