فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

خلاصه‌سازی موضوعی متون با استفاده از تجزیه تانسور‌های سه‌بعدی توسط الگوریتم آنالیز معنایی پنهان زمانی

نویسنده (ها)
  • عطیه بیابانگرد
مربوط به کنفرانس بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده امروزه یکی از موضوعات مهم و مورد توجه پژوهشگران در زمینه بازیابی اطلاعات، خلاصه‌سازی خودکار متن می‌باشد. در همین راستا، متونِ مختلف را می‌توان در غالب ماتریس‌های دوبُعدی کلمه-سند ذخیره نمود. همچنین تاکنون بیشتر خلاصه‌سازی‌های انجام شده، روی ماتریس‌های دوبعدی حاصل از متن انجام شده است. این ماتریس‌ها را می‌توان با اضافه نمودن بعدهای اطلاعاتی متفاوت، به آرایه‌های چندبعدی مختلفی به‌نام تانسور تبدیل کرد که حاوی اطلاعات بیشتری نسبت به ماتریس‌های دوبعدی باشند. ازجمله‌ی این ابعاد اطلاعاتی، بعد جغرافیا، زمان، معنا و مفهوم، نویسندگان و ... می‌باشد. در این مقاله، با اضافه نمودن بعد زمان به ماتریس کلمه-سند، تانسور کلمه-سند-زمان ایجاد و سپس روش جدیدی برای خلاصه‌سازی ارائه شده است. در مدل پیشنهادی با استفاده از روش «آنالیز معنایی پنهان زمانی» به تجزیه تانسورها پرداخته و زمینه اصلی متون و اهمیت موضوعی هرسند در طول زمان مشخص می‌شود. سپس با محاسبه شباهت معنایی جملات براساس وردنت، جملاتِ مشابه با اهمیت کمتر حذف می‌شوند تا خلاصه نهایی عاری از هرگونه مفاهیم تکراری باشد. ارزیابی روش پیشنهادی بر روی مجموعه داده‌ی استاندارد DUC2007 و با استفاده از معیار ارزیابی ROUGE صورت گرفته است که نتایج حاصل شده، نشان از برتری روش پیشنهادی نسبت به سیستم‌های هم‌رده دارد.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله