فا | En

ورود به سایت

صفحه اصلی

درباره ما

کنفرانس‌ها و رخدادها

کارگاه‌ها و سمینارها

سایت‌های مرتبط

پرداخت‌ها

مشاهده‌ مشخصات مقاله

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند

نویسنده (ها)	محمد احسان بصیری شهلا نعمتی ناصر قاسم آقایی
مربوط به کنفرانس	سیزدهمین کنفرانس ملی و بین‌المللی سالانه انجمن کامپیوتر ایران
چکیده	در این مقاله به بررسی دسته بندی متن فارسی با استفاده از الگوریتمهای fkNN و kNN خواهیم پرداخت. آزمایشها بر روی ششصد سند متنی که به شش دسته تقسیم میشوند، انجام شدهاند. هدف اساسی این بررسی، مقایسه دو الگوریتم مذکور برای دسته بندی متن فارسی و ترکیب آنها با روشهای انتخاب ویژگی بهره اطلاعات IG فرکانس سند DF است. از این دو روش برای انتخاب ویژگیها و کاستن از ابعاد فضای ویژگیها استفاده شده است. نتایج نشان میدهند که دقت الگوریتم fkNN از الگوریتم kNN بهتر است. همچنین دقت دستهبندی با استفاده از ترکیب fkNN و IG از سایر ترکیبها بیشتر میباشد. دقت دسته بندی در بهترین حالت به 0.804 دقت میکرو – F1 و 0.755 دقت ماکرو F1- رسید. همچنین میتوان نتیجه گرفت که IG بیشتر از DF دقت را بالا میبرد . در بین دسته های موجود بهترین دستهبندی در مورد بزرگترین دسته یعنی اسناد مربوط به دسته اقتصادی انجام گرفت. دقت دستهبندی برای این دسته تا 0.910 دقت ماکرو F1- و 0.945 دقت میکرو F1- رسید.
قیمت	برای اعضای سایت : ۱٠٠,٠٠٠ ریال برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله

کنفرانس‌ها و رخدادها

آرشیو کنفرانس‌ها

آرشیو مقالات

رخدادهای مرتبط

عضویت در انجمن کامپیوتر ایران

تمام حقوق مادی و معنوی این سایت متعلق به انجمن کامپیوتر ایران می باشد و استفاده از مطالب با ذکر منبع بلامانع است.