مشاهده مشخصات مقاله
استخراج کلمات کلیدی با استفاده از خوشهبندی و تخصیص پنهان دیریکله
Authors |
-
عاطفه قهرمانیفر
-
سید ابوالقاسم میرروشندل
|
Conference |
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
Abstract |
استخراج کلمات کلیدی یکی از مسائل مهم، در پردازش متن است. کلمات کلیدی خلاصهای سطح بالا و دقیق از یک متن را ارائه میدهند. بنابراین آنها برای بازیابی متن، طبقهبندی، جستجو موضوع و کارهای دیگر بسیار مهم هستند. اطلاعات روز به روز در حال رشد است. بنابراین خواندن و خلاصهسازی مطالب از نوشتههای کوتاه و طولانی و تبدیل آن به یک مجموعهی کوچک از موضوعات دشوار و وقتگیر برای انسان است که با استفاده از نیروی انسانی محدود تقریبا غیرممکن است. اهمیت کلمات کلیدی و هزینهی تفسیر دستی آنها باعث استخراج کلمات کلیدی به صورت خودکار شده است. ایدهی اصلی، انتخاب کلماتی است که یک تصویر خوب از محتوای آن متن بدهند. روش ارائه شده در این مقاله، ترکیبی از الگوریتمهای شباهتسنجی، خوشهبندی و تخصیص پنهان دیریکله است. الگوریتم پیشنهادی بر روی یک مجموعه داده، شامل 2000 چکیدهی مقاله انجام شد و بر روی 150 نمونه، به صورت تصادفی ارزیابی انجام شده است که در نهایت دقت، 90% و فراخوانی 65% بدست آمد. نتایج بدست آمده نشان دهندهی کارایی مناسب الگوریتم ارائه شده است. مدل پیشنهادی محدود به دادههای کوتاه نیست و برای مجموعه دادههای بزرگتر و طولانیتر هم مناسب است. |
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|