فا   |   En
Login
مشاهده‌ مشخصات مقاله

ارائه یک روش مبتنی بر شباهت ساختار خوشه‌های درون زیرفضایی برای خوشه‌بندی داده‌های با ابعاد بالا

Authors
  • کاوان فاتحی
  • منصور فاتح
  • محسن رضوانی
Conference بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract مشکل تنگنای ابعاد در مجموعه داده‌های با ابعاد بالا از مسائل مهم در حیطه خوشه‌بندی داده‌ها است. در سال‌های اخیر برای حل این مشکل، روش‌های خوشه‌بندی زیر‌فضا مورد توجه بسیاری از محققان قرار گرفته است. هدف اصلی خوشه‌بندی زیر¬فضایی، یافتن تمام خوشه‌ها در تمام زیرفضاهای ممکن است. مشکل اصلی روش‌های پیشین خوشه‌بندی زیر‌فضایی، ایجاد تعداد بسیار زیادی زیرفضا است. این مشکل منجر به کاهش کارایی و افزایش زمان اجرای الگوریتم‌ها شده است. در این مقاله روشی کارا مبتنی بر چگالی برای ایجاد بهینه زیرفضاها ارائه شده است. این الگوریتم به صورت پایین به بالا عمل کرده و با استفاده از معیارهای مختلف شباهت، زیرفضاهای مشابه را با تکرار چندین باره الگوریتم پیدا و ترکیب می¬نماید. برای این منظور الگوریتم پیشنهادی در هر تکرار، پس از ترکیب و تشکیل زیرفضاهایی با ابعاد بالاتر، داده‌های موجود در این زیرفضاها را دوباره خوشه‌بندی می¬کند. این خوشه‌بندی به منظور، بدست آوردن ساختار جدید خوشه‌ها انجام می¬شود. در نهایت الگوریتم پیشنهادی، تمام زیرفضاهای ممکن در داده‌ها را تشخیص داده و همه‌ی خوشه‌های ممکن را می¬یابد. برای ارزیابی روش پیشنهادی از مجموعه داده‌های مصنوعی و واقعی مختلفی استفاده شده است. روش پیشنهادی در مقایسه با روش های پیشین از دقت و سرعت بهتری برخوردار است. روش پیشنهادی 34 درصد نسبت به الگوریتم CLIQUE و 6 درصد نسبت به DiSH دقت بالاتری دارد. همچنین روش پیشنهادی، برخلاف روش‌هاش پیشین، توانایی یافتن زیرفضاها در ابعاد مختلف را دارد.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله