مشاهده مشخصات مقاله
بهاره داودآبادی فراهانی, سید امید فاطمی
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
به منظور بهبود دستهبندی اسناد چندین رویکرد مختلف وجود دارد که یکی از مهمترین آنها استفاده از بردار ویژگی مناسب است. در دستهبندی اسناد معمولاً کلمات، اجزای بردار ویژگی را تشکیل میدهند. از آنجایی که در هر مجموعهی اسناد تعداد بسیار زیادی کلمه وجود دارد؛ در این مقاله روشی نوین برای تولید بردار ویژگی مناسب، به منظور بهبود دسته-بندی اسناد علمی فارسی ارائه میشود. روش پیشنهادی ارتباطات معنایی بین کلمات هر سند را با استفاده از اصطلاحنامه استخراج میکند. سپس به منظور انتخاب ویژگیهای دستهبند، روش نوین و کارآمد گروهبندی کلمات سند از لحاظ ارتباطات معنایی را، بکار میگیرد. برای ارزیابی و مقایسه روش پیشنهادی از مجموعه پایاننامههای ایرانداک (پژوهشگاه علوم و فناوری اطلاعات ایران) استفاده میشود. نتایج آزمایشات نشان میدهد، عملکرد دستهبندی با بکارگیری این روش نسبت به انتخاب ویژگی بدون استفاده از اصطلاحنامه به صورت قابل توجهی افزایش مییابد.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال