مشاهده مشخصات مقاله
پردازش عبارت در موتور جستجو
نویسنده (ها) |
-
جواد پاک سيما
-
علي محمد زارع بيدکي
-
ولي درهمي
|
مربوط به کنفرانس |
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
تحقيقات زياد روي موتورهاي جستجو نشان ميدهد که اکثر پرس و جوهاي کاربران بيش از يک کلمه ميباشد و ممکن است بطور مشخص با استفاده از علامت نقل قول به عنوان عبارت معرفي شده باشند يا از علامت نقل قول استفاده نشده باشد ولي در بيشتر مواقع منظور کاربر يک عبارت باشد. اکثر الگوريتمهاي رتبه بندي از فرکانس رخداد يک کلمه در سند(TF) براي امتياز دهي به اسناد استفاده ميکنند اما براي عبارت تعريف روشني از اين پارامتر وجود ندارد. از طرفي تعداد رخداد يک عبارت به تنهايي مفيد نيست و بايد فاصله بين کلمات عبارت محاسبه گردد. در اين مقاله پارامترهاي فاصله، فرکانس رخداد يک عبارت(PF) و IDF با توجه به فاصله تعريف ميشود و الگوريتمهايي براي محاسبه آنها ارائه ميگردد. همچنين نتايج الگوريتم پيشنهادي با الگوريتم پياده سازي شده توسط نمايه ساز متن باز لوسين مقايسه گرديده است. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|