مشاهده مشخصات مقاله
خلاصهسازی موضوعی متون با استفاده از تجزیه تانسورهای سهبعدی توسط الگوریتم آنالیز معنایی پنهان زمانی
Authors |
|
Conference |
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
Abstract |
امروزه یکی از موضوعات مهم و مورد توجه پژوهشگران در زمینه بازیابی اطلاعات، خلاصهسازی خودکار متن میباشد. در همین راستا، متونِ مختلف را میتوان در غالب ماتریسهای دوبُعدی کلمه-سند ذخیره نمود. همچنین تاکنون بیشتر خلاصهسازیهای انجام شده، روی ماتریسهای دوبعدی حاصل از متن انجام شده است. این ماتریسها را میتوان با اضافه نمودن بعدهای اطلاعاتی متفاوت، به آرایههای چندبعدی مختلفی بهنام تانسور تبدیل کرد که حاوی اطلاعات بیشتری نسبت به ماتریسهای دوبعدی باشند. ازجملهی این ابعاد اطلاعاتی، بعد جغرافیا، زمان، معنا و مفهوم، نویسندگان و ... میباشد. در این مقاله، با اضافه نمودن بعد زمان به ماتریس کلمه-سند، تانسور کلمه-سند-زمان ایجاد و سپس روش جدیدی برای خلاصهسازی ارائه شده است. در مدل پیشنهادی با استفاده از روش «آنالیز معنایی پنهان زمانی» به تجزیه تانسورها پرداخته و زمینه اصلی متون و اهمیت موضوعی هرسند در طول زمان مشخص میشود. سپس با محاسبه شباهت معنایی جملات براساس وردنت، جملاتِ مشابه با اهمیت کمتر حذف میشوند تا خلاصه نهایی عاری از هرگونه مفاهیم تکراری باشد. ارزیابی روش پیشنهادی بر روی مجموعه دادهی استاندارد DUC2007 و با استفاده از معیار ارزیابی ROUGE صورت گرفته است که نتایج حاصل شده، نشان از برتری روش پیشنهادی نسبت به سیستمهای همرده دارد. |
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|