فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

ارائه یک روش مبتنی بر شباهت ساختار خوشه‌های درون زیرفضایی برای خوشه‌بندی داده‌های با ابعاد بالا

نویسنده (ها)
  • کاوان فاتحی
  • منصور فاتح
  • محسن رضوانی
مربوط به کنفرانس بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده مشکل تنگنای ابعاد در مجموعه داده‌های با ابعاد بالا از مسائل مهم در حیطه خوشه‌بندی داده‌ها است. در سال‌های اخیر برای حل این مشکل، روش‌های خوشه‌بندی زیر‌فضا مورد توجه بسیاری از محققان قرار گرفته است. هدف اصلی خوشه‌بندی زیر¬فضایی، یافتن تمام خوشه‌ها در تمام زیرفضاهای ممکن است. مشکل اصلی روش‌های پیشین خوشه‌بندی زیر‌فضایی، ایجاد تعداد بسیار زیادی زیرفضا است. این مشکل منجر به کاهش کارایی و افزایش زمان اجرای الگوریتم‌ها شده است. در این مقاله روشی کارا مبتنی بر چگالی برای ایجاد بهینه زیرفضاها ارائه شده است. این الگوریتم به صورت پایین به بالا عمل کرده و با استفاده از معیارهای مختلف شباهت، زیرفضاهای مشابه را با تکرار چندین باره الگوریتم پیدا و ترکیب می¬نماید. برای این منظور الگوریتم پیشنهادی در هر تکرار، پس از ترکیب و تشکیل زیرفضاهایی با ابعاد بالاتر، داده‌های موجود در این زیرفضاها را دوباره خوشه‌بندی می¬کند. این خوشه‌بندی به منظور، بدست آوردن ساختار جدید خوشه‌ها انجام می¬شود. در نهایت الگوریتم پیشنهادی، تمام زیرفضاهای ممکن در داده‌ها را تشخیص داده و همه‌ی خوشه‌های ممکن را می¬یابد. برای ارزیابی روش پیشنهادی از مجموعه داده‌های مصنوعی و واقعی مختلفی استفاده شده است. روش پیشنهادی در مقایسه با روش های پیشین از دقت و سرعت بهتری برخوردار است. روش پیشنهادی 34 درصد نسبت به الگوریتم CLIQUE و 6 درصد نسبت به DiSH دقت بالاتری دارد. همچنین روش پیشنهادی، برخلاف روش‌هاش پیشین، توانایی یافتن زیرفضاها در ابعاد مختلف را دارد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله