فا   |   En
Login
مشاهده‌ مشخصات مقاله

استخراج کلمات کلیدی با استفاده از خوشه‌بندی و تخصیص پنهان دیریکله

Authors
  • عاطفه قهرمانی‌فر
  • سید ابوالقاسم میرروشندل
Conference بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract استخراج کلمات کلیدی یکی از مسائل مهم، در پردازش متن است. کلمات کلیدی خلاصه‌ای سطح بالا و دقیق از یک متن را ارائه می‌دهند. بنابراین آن‌ها برای بازیابی متن، طبقه‌بندی، جستجو موضوع و کارهای دیگر بسیار مهم هستند. اطلاعات روز به روز در حال رشد است. بنابراین خواندن و خلاصه‌سازی مطالب از نوشته‌های کوتاه و طولانی و تبدیل آن به یک مجموعه‌ی کوچک از موضوعات دشوار و وقت‌گیر برای انسان است که با استفاده از نیروی انسانی محدود تقریبا غیرممکن است. اهمیت کلمات کلیدی و هزینه‌ی تفسیر دستی آن‌ها باعث استخراج کلمات کلیدی به صورت خودکار شده است. ایده‌ی اصلی، انتخاب کلماتی است که یک تصویر خوب از محتوای آن متن بدهند. روش ارائه شده در این مقاله، ترکیبی از الگوریتم‌های شباهت‌سنجی، خوشه‌بندی و تخصیص پنهان دیریکله است. الگوریتم پیشنهادی بر روی یک مجموعه داده، شامل 2000 چکیده‌ی مقاله انجام شد و بر روی 150 نمونه، به صورت تصادفی ارزیابی انجام شده است که در نهایت دقت، 90% و فراخوانی 65% بدست آمد. نتایج بدست آمده نشان دهنده‌ی کارایی مناسب الگوریتم ارائه شده است. مدل پیشنهادی محدود به داده‌های کوتاه نیست و برای مجموعه داده‌های بزرگتر و طولانی‌تر هم مناسب است.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله