مشاهده مشخصات مقاله
استفاده از ساختار تصریفی واژهها جهت بهبود مترجم ماشینی آماری فارسی به انگلیسی
نویسنده (ها) |
|
مربوط به کنفرانس |
هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
چکیده |
مترجم ماشینی آماری، يک نمونه از ماشینهای ترجمه است که ترجمه در آن بر اساس مدلهای آماری انجام میشود. در این روش پارامترها توسط تحلیل پیکره موازی به دست میآیند و اگر یادگیری ترجمهی واژهها بهتر انجام شود، کیفیت ترجمه بالا میرود. با استفاده از تقطیع تکواژهها، واژههای خارج از واژگان موجود و همچنین اندازهی واژهنامه به طور چشمگیری کاهش مییابد. وقتی با زبانهای با ساختار صرفی غنی نظیر فارسی سروکار داریم، نیاز به این تقطیعکنندهی تکواژهها پراهمیتتر میشود. تعیین دانهبندی مشابه برای واژهها در هر دو زبان مبدأ و مقصد، میتواند کیفیت ترازبندی در پيکرهی موازی را افزایش دهد. در این مقاله با ارایه طرحهای مختلف و ترکیبی برای تقطیع تکواژهها، متن فارسی به انگلیسی ترجمه میشود که بهترین طرح به عنوان طرح شبه انگلیسی نامگذاری شده است. با استفاده از طرح مذکور کیفیت ترجمه با معیارBLEU، 3 امتیاز نسبت به ماشین مترجم آماری مبتنی بر عبارت پایه بهبود یافته است. همچنین خروجیها به خوبی نشان میدهند که کیفیت ترجمه برتر از کیفیت ترجمهی مترجم Google Translator است. واژههای خارج از واژگان موجود نیز به شدت کاهش یافتهاند. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|