انجمن کامپیوتر ایران

برای عضویت کلیک کنید
Filter Parent not found! Please put the posts element on the page, and turn on 'Enable Post Filtering' option on it

مشاهده‌ مشخصات مقاله

استخراج کلمات کلیدی از متون فارسی برمبنای روش‌های آماری و ساختار سند

طاهره استیری, سیدامید فاطمی

نویسنده (ها)

هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫

مربوط به کنفرانس

کلمات کلیدی منابع ارزشمندی برای سازماندهی و بازیابی اسناد می¬باشند، از این رو تا کنون روش¬های بسیاری برای تولید خودکار این کلمات پیشنهاد شده است؛ اما اکثر این روش¬ها به مجموعه¬های آموزشی، فرآیندهای یادگیری و یا دسترسی به منابع زبان¬شناختی مانند فرهنگ لغت نیاز دارند. با توجه به محدودیت دسترسی به این منابع، مخصوصاً در زبان فارسی، نیاز به روشی احساس می¬شود که مستقل از این منابع بتواند کلمات کلیدی را از متون استخراج نماید. روش پیشنهادی دراین مقاله مبتنی بر روش¬های آماری می¬باشد و بدون نیاز به منابع اضافی و تنها با در اختیار داشتن مجموعهاسناد و براساس ساختار سند، کلمات کلیدی را با کارایی قابل قبولی استخراج می¬نماید. بمنظور ارزیابی و مقایسه کارایی روش پیشنهادی از مجموعه داده¬ای همشهری استفاده شده است و نشان داده شده که این روش،کارایی استخراج خودکار کلمات کلیدی را نسبت به روش¬های آماری معمولی بهبود داده است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت