مشاهده مشخصات مقاله
هشام فیلی, محسن عرب سرخی
چهاردهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
هدف از خوشه بندي متون تقسیم بندي مس تندات به یک یا چند خوشه بر اساس محتویات موجود در متن آن است که از ابزارهاي مهم در حوزه پردازش زبان هاي طبیعی به شمار می آید . خوشه بندي متون در ابزارهایی مانند موتورهاي جستجو و سیستم پاسخگویی به سوالات کاربرد هاي فراوانی دارد . روشهاي مختلفی براي خوشه بندي موضوعی متون وجود دارد که استفاده از مدل احتمالاتی بیزین یکی از متداولترین روش ها به شمار می آید. در این مقاله گزارشی از بکارگیري این روش در خوشه بندي متون فارسی ارائه میشود و سپس از ترکیب این روش با ایده نگهداري کلمات هماورد 1 کیفیت الگوریتم بهبود داده میشود. استفاده از این ایده بر روي 200,000 متن خبري از منابع خبرگزاري جمهوري اسلامی ایران (ایرنا ) توانسته است میزان دقت خوشهبندي در زبان فارسی را به 87 % افزایش دهد.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال