انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

بهبود مدل‌سازی موضوعی اسناد با استفاده از دانش نهفته در مجموعه‌ی سندی

رضا شکرچیان, ناصر یزدانی

نویسنده (ها)

بیست و یکمین کنفرانس ملی سالانه انجمن کامپیوتر

مربوط به کنفرانس

مدل‌سازی موضوعی یکی از روش‌های مرسوم یافتن موضوعات نهان در مجموعه‌ی اسناد می‌باشد. اکثر روش‌های مدل‌سازی موضوعی به صورت بدون نظارتی می‌باشند و معمولا از انسجام لازم برخوردار نیستند. برای افزایش دقت و کیفیت موضوعات تلاش شده تا از دانش کاربران به عنوان اطلاعات اولیه در مدل‌سازی استفاده شود. استفاده از دانش‌کاربران هزینه‌بر می‌باشد. برخی روش‌ها استفاده از دانش کاربران را کنار گذاشته و برای بهبود نتایج سعی کرده‌اند از پایگاه‌های دانش و یا دانش حاصل از مجموعه‌های مشابه استفاده کنند. فرض ما در این مقاله این است که مجموعه‌ی سندی مورد بررسی برای یک سازمان با دامنه‌لغات و دانش خاص خود می‌باشد و مجموعه‌ي اسنادی مشابه با آن در دسترس نیست. در این صورت استفاده از پایگاه‌های دانشی‌ای همچون وردنت و یا ویکی‌پدیا بر روی چنین مجموعه‌ای توجیه پذیر نیست. در این مقاله تلاش شده تا تنها با تکیه بر دانش نهفته در مجموعه‌ی اسناد و بدون کمک گرفتن از دانش خارجی، مدل‌سازی موضوعی بهبود داده شود و موضوعاتی منسجم‌تولید گردد. این دانش بر اساس ارتباط-بایسته و ارتباط-نبایسته میان تعدادی از کلمات مجموعه می‌باشد. نمودارها نشان‌می‌دهد که روش پیشنهادی موجب بهبود در نتایج شده است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت