فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند

نویسنده (ها)
  • محمد احسان بصیری
  • شهلا نعمتی
  • ناصر قاسم آقایی
مربوط به کنفرانس سیزدهمین کنفرانس ملی و بین‌المللی سالانه انجمن کامپیوتر ایران
چکیده در این مقاله به بررسی دسته بندی متن فارسی با استفاده از الگوریتمهای fkNN و kNN خواهیم پرداخت. آزمایشها بر روی ششصد سند متنی که به شش دسته تقسیم میشوند، انجام شدهاند. هدف اساسی این بررسی، مقایسه دو الگوریتم مذکور برای دسته بندی متن فارسی و ترکیب آنها با روشهای انتخاب ویژگی بهره اطلاعات IG فرکانس سند DF است. از این دو روش برای انتخاب ویژگیها و کاستن از ابعاد فضای ویژگیها استفاده شده است. نتایج نشان میدهند که دقت الگوریتم fkNN از الگوریتم kNN بهتر است. همچنین دقت دستهبندی با استفاده از ترکیب fkNN و IG از سایر ترکیبها بیشتر میباشد. دقت دسته بندی در بهترین حالت به 0.804 دقت میکرو – F1 و 0.755 دقت ماکرو F1- رسید. همچنین میتوان نتیجه گرفت که IG بیشتر از DF دقت را بالا میبرد . در بین دسته های موجود بهترین دستهبندی در مورد بزرگترین دسته یعنی اسناد مربوط به دسته اقتصادی انجام گرفت. دقت دستهبندی برای این دسته تا 0.910 دقت ماکرو F1- و 0.945 دقت میکرو F1- رسید.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله