فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

دسته بندي موضوعي متون فارسي بر اساس روش آناليز معنايي پنهان احتمالاتي بهبود يافته

نویسنده (ها)
  • طاهره امامي آزادي
  • فرشاد الماس گنج
مربوط به کنفرانس دوازدهمین کنفرانس بین‌المللی سالانه انجمن کامپیوتر ایران
چکیده با توجه به رشد روزافزون حجم متون و لزوم دستيابي مناسب و استخراج اطلاعات از آنها، دسته بندي بدون سرپرست متون اهميت زيادي پيدا کرده است. روش آناليز معنايي پنهان احتمالاتي » (PLSA) ، يكي از روشهايي است كه در سالهاي اخير در دسته بندي متون مورد توجه قرار گرفته است. روش PLSA که بر پاية آناليز معنايي پنهان » يا (LSA) است، داراي زيربناي آماري محکمي بوده و در زمينههاي مختلف کار با متون عملکرد بسيار خوبي داشته است. در اين مقاله روش PLSA به منظور بيان مناسب متون در فضاي کاهش بعد يافتة معنايي و نيز دسته بندي متون مورد استفاده قرار گرفت و روشي براي بهبود مدل PLSA با حذف متغيرهاي پنهان نامناسب در حين تعليم پيشنهاد شد. آزمايشات بر روي تعدادي متن فارسي شامل ۶ موضوع کلي و داراي برچسب موضوعي كه از پيرة متني « فار س دات انتخاب شده بودند، صورت گرفت. با استفاده از روش PLSA به همراه الگوريتم ساده k-means به ۸۷,۲۳% صحت دستهبندي دست يافتيم که %6.09 بيشتر از روش LSA در کنار مدل k-means بود. همچنين توانستيم با استفاده از روش PLSA بهبود يافتة پيشنهادي صحت دستهبندي را نسبت به روش PLSA ، 3.75% افزايش دهيم.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله