فا   |   En
Login
مشاهده‌ مشخصات مقاله

استفاده از ساختار تصریفی واژه‌ها جهت بهبود مترجم ماشینی آماری فارسی به انگلیسی

Authors
  • سامان نامدار
  • هشام فیلی
Conference هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
Abstract مترجم ماشینی آماری، يک نمونه از ماشین‌های ترجمه است که ترجمه در آن بر اساس مدل‌های آماری انجام می‌شود. در این روش پارامترها توسط تحلیل پیکره موازی به دست می‌آیند و اگر یادگیری ترجمه‌ی واژه‌ها بهتر انجام شود، کیفیت ترجمه بالا می‌رود. با استفاده از تقطیع تکواژه‌ها، واژه‌های خارج از واژگان موجود و همچنین اندازه‌ی واژه‌نامه به طور چشمگیری کاهش می‌یابد. وقتی با زبان‌های با ساختار صرفی غنی نظیر فارسی سروکار داریم، نیاز به این تقطیع‌کننده‌ی تکواژه‌ها پر‌اهمیت‌تر می‌شود. تعیین دانه‌بندی مشابه برای واژه‌ها در هر دو زبان مبدأ و مقصد، می‌تواند کیفیت ترازبندی در پيکره‌ی موازی را افزایش دهد. در این مقاله با ارایه طرح‌های مختلف و ترکیبی برای تقطیع تکواژه‌ها، متن فارسی به انگلیسی ترجمه می‌شود که بهترین طرح به عنوان طرح شبه انگلیسی نامگذاری شده است. با استفاده از طرح مذکور کیفیت ترجمه با معیارBLEU، 3 امتیاز نسبت به ماشین مترجم آماری مبتنی بر عبارت پایه بهبود یافته است. همچنین خروجی‌ها به خوبی نشان می‌دهند که کیفیت ترجمه برتر از کیفیت ترجمه‌ی مترجم Google Translator است. واژه‌های خارج از واژگان موجود نیز به شدت کاهش یافته‌اند.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله