مشاهده مشخصات مقاله
خلاصهسازی موضوعی متون با استفاده از تجزیه تانسورهای سهبعدی توسط الگوریتم آنالیز معنایی پنهان زمانی
نویسنده (ها) |
|
مربوط به کنفرانس |
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
امروزه یکی از موضوعات مهم و مورد توجه پژوهشگران در زمینه بازیابی اطلاعات، خلاصهسازی خودکار متن میباشد. در همین راستا، متونِ مختلف را میتوان در غالب ماتریسهای دوبُعدی کلمه-سند ذخیره نمود. همچنین تاکنون بیشتر خلاصهسازیهای انجام شده، روی ماتریسهای دوبعدی حاصل از متن انجام شده است. این ماتریسها را میتوان با اضافه نمودن بعدهای اطلاعاتی متفاوت، به آرایههای چندبعدی مختلفی بهنام تانسور تبدیل کرد که حاوی اطلاعات بیشتری نسبت به ماتریسهای دوبعدی باشند. ازجملهی این ابعاد اطلاعاتی، بعد جغرافیا، زمان، معنا و مفهوم، نویسندگان و ... میباشد. در این مقاله، با اضافه نمودن بعد زمان به ماتریس کلمه-سند، تانسور کلمه-سند-زمان ایجاد و سپس روش جدیدی برای خلاصهسازی ارائه شده است. در مدل پیشنهادی با استفاده از روش «آنالیز معنایی پنهان زمانی» به تجزیه تانسورها پرداخته و زمینه اصلی متون و اهمیت موضوعی هرسند در طول زمان مشخص میشود. سپس با محاسبه شباهت معنایی جملات براساس وردنت، جملاتِ مشابه با اهمیت کمتر حذف میشوند تا خلاصه نهایی عاری از هرگونه مفاهیم تکراری باشد. ارزیابی روش پیشنهادی بر روی مجموعه دادهی استاندارد DUC2007 و با استفاده از معیار ارزیابی ROUGE صورت گرفته است که نتایج حاصل شده، نشان از برتری روش پیشنهادی نسبت به سیستمهای همرده دارد. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|