فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

استفاده از ساختار تصریفی واژه‌ها جهت بهبود مترجم ماشینی آماری فارسی به انگلیسی

نویسنده (ها)
  • سامان نامدار
  • هشام فیلی
مربوط به کنفرانس هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
چکیده مترجم ماشینی آماری، يک نمونه از ماشین‌های ترجمه است که ترجمه در آن بر اساس مدل‌های آماری انجام می‌شود. در این روش پارامترها توسط تحلیل پیکره موازی به دست می‌آیند و اگر یادگیری ترجمه‌ی واژه‌ها بهتر انجام شود، کیفیت ترجمه بالا می‌رود. با استفاده از تقطیع تکواژه‌ها، واژه‌های خارج از واژگان موجود و همچنین اندازه‌ی واژه‌نامه به طور چشمگیری کاهش می‌یابد. وقتی با زبان‌های با ساختار صرفی غنی نظیر فارسی سروکار داریم، نیاز به این تقطیع‌کننده‌ی تکواژه‌ها پر‌اهمیت‌تر می‌شود. تعیین دانه‌بندی مشابه برای واژه‌ها در هر دو زبان مبدأ و مقصد، می‌تواند کیفیت ترازبندی در پيکره‌ی موازی را افزایش دهد. در این مقاله با ارایه طرح‌های مختلف و ترکیبی برای تقطیع تکواژه‌ها، متن فارسی به انگلیسی ترجمه می‌شود که بهترین طرح به عنوان طرح شبه انگلیسی نامگذاری شده است. با استفاده از طرح مذکور کیفیت ترجمه با معیارBLEU، 3 امتیاز نسبت به ماشین مترجم آماری مبتنی بر عبارت پایه بهبود یافته است. همچنین خروجی‌ها به خوبی نشان می‌دهند که کیفیت ترجمه برتر از کیفیت ترجمه‌ی مترجم Google Translator است. واژه‌های خارج از واژگان موجود نیز به شدت کاهش یافته‌اند.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله