مشاهده مشخصات مقاله
رضا شکرچیان, ناصر یزدانی
بیست و یکمین کنفرانس ملی سالانه انجمن کامپیوتر
مدلسازی موضوعی یکی از روشهای مرسوم یافتن موضوعات نهان در مجموعهی اسناد میباشد. اکثر روشهای مدلسازی موضوعی به صورت بدون نظارتی میباشند و معمولا از انسجام لازم برخوردار نیستند. برای افزایش دقت و کیفیت موضوعات تلاش شده تا از دانش کاربران به عنوان اطلاعات اولیه در مدلسازی استفاده شود. استفاده از دانشکاربران هزینهبر میباشد. برخی روشها استفاده از دانش کاربران را کنار گذاشته و برای بهبود نتایج سعی کردهاند از پایگاههای دانش و یا دانش حاصل از مجموعههای مشابه استفاده کنند. فرض ما در این مقاله این است که مجموعهی سندی مورد بررسی برای یک سازمان با دامنهلغات و دانش خاص خود میباشد و مجموعهي اسنادی مشابه با آن در دسترس نیست. در این صورت استفاده از پایگاههای دانشیای همچون وردنت و یا ویکیپدیا بر روی چنین مجموعهای توجیه پذیر نیست. در این مقاله تلاش شده تا تنها با تکیه بر دانش نهفته در مجموعهی اسناد و بدون کمک گرفتن از دانش خارجی، مدلسازی موضوعی بهبود داده شود و موضوعاتی منسجمتولید گردد. این دانش بر اساس ارتباط-بایسته و ارتباط-نبایسته میان تعدادی از کلمات مجموعه میباشد. نمودارها نشانمیدهد که روش پیشنهادی موجب بهبود در نتایج شده است.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال