فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

تشخیص موضوع در متون خبری با استفاده از گام برداری تصادفی تقویتی

نویسنده (ها)
  • سپهر آروین
  • علی ورداسبی
  • هشام فیلی
  • آزاده شاکری
مربوط به کنفرانس بیست و دومین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده تشخیص موضوع بر روی متون مختلف از جمله متون خبری یکی از مسائلی است که در سال‌های اخیر مورد توجه قرار گرفته و پژوهش‌های گوناگونی بر روی آن انجام شده است. برای حل این مسئله روش‌های مختلفی ارائه شده که در آن‌ها معمولاً به تعیین فاصله میان متون و خوشه‌بندی آن‌ها می‌پردازند و یا در برخی از پژوهش‌ها از روش‌های مدل‌سازی موضوعی برای حل این مسئله استفاده می‌‌کنند. هدف این روش‌‌ها در نهایت تقسیم‌‌‌‌بندی این متون به خوشه‌‌های مختلف است به شکلی که هر خوشه شامل متونی باشد که از نظر موضوع به هم نزدیک ‌‌باشند. از جمله روش‌‌های مورد استفاده برای خوشه‌‌بندی اسناد K-medoids است که این گونه از روش‌‌های خوشه‌‌بندی به انتخاب مراکز اولیه حساس بوده و با انتخاب مراکز اولیه مختلف نتیجه‌‌ی خوشه‌‌بندی تغییر می‌‌کند. در این مقاله یک روش تشخیص موضوع ارائه می‌‌شود که در این روش ابتدا برای تعیین فاصله میان اسناد از یکی از روش‌‌های مدل‌‌سازی موضوعی یعنی LDA (Latent Dirichlet Allocation) استفاده می‌‌کنیم. با بهره‌‌گیری از توزیع LDA اسناد، فاصله میان اسناد محاسبه شده و از روی آن گراف اخبار که نشان‌‌دهنده‌‌ی میزان شباهت میان اخبار است تولید می‌‌شود. گراف حاصل توسط الگوریتم K-medoids خوشه‌‌بندی می‌‌شود.‌‌ با توجه به حساس بودن این گونه از روش‌‌های خوشه‌‌بندی به مراکز اولیه، با استفاده از DivRank که یک روش گام‌‌برداری تصادفی تقویتی است مراکز اولیه مناسب مشخص می‌شوند و در اختیار الگوریتم K-medoids قرار می‌‌گیرند. آزمایش‌‌های ما بر روی مجموعه‌‌دادگان مختلف نشان می‌‌دهد که روش ما در نحوه‌‌ی تولید گراف و یافتن مراکز اولیه‌‌ی مناسب برای الگوریتم K-medoids در مجموع در روند تشخیص موضوع بهبود ایجاد می‌‌کند و در مقایسه با انتخاب تصادفی مراکز اولیه، با احتمالی بین 70% تا 92% (بسته به مجموعه‌دادگان متفاوت) به معیار F بالاتری می‌توان دست یافت.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله