مشاهده مشخصات مقاله
استفاده از ساختار تصریفی واژهها جهت بهبود مترجم ماشینی آماری فارسی به انگلیسی
Authors |
|
Conference |
هجدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
Abstract |
مترجم ماشینی آماری، يک نمونه از ماشینهای ترجمه است که ترجمه در آن بر اساس مدلهای آماری انجام میشود. در این روش پارامترها توسط تحلیل پیکره موازی به دست میآیند و اگر یادگیری ترجمهی واژهها بهتر انجام شود، کیفیت ترجمه بالا میرود. با استفاده از تقطیع تکواژهها، واژههای خارج از واژگان موجود و همچنین اندازهی واژهنامه به طور چشمگیری کاهش مییابد. وقتی با زبانهای با ساختار صرفی غنی نظیر فارسی سروکار داریم، نیاز به این تقطیعکنندهی تکواژهها پراهمیتتر میشود. تعیین دانهبندی مشابه برای واژهها در هر دو زبان مبدأ و مقصد، میتواند کیفیت ترازبندی در پيکرهی موازی را افزایش دهد. در این مقاله با ارایه طرحهای مختلف و ترکیبی برای تقطیع تکواژهها، متن فارسی به انگلیسی ترجمه میشود که بهترین طرح به عنوان طرح شبه انگلیسی نامگذاری شده است. با استفاده از طرح مذکور کیفیت ترجمه با معیارBLEU، 3 امتیاز نسبت به ماشین مترجم آماری مبتنی بر عبارت پایه بهبود یافته است. همچنین خروجیها به خوبی نشان میدهند که کیفیت ترجمه برتر از کیفیت ترجمهی مترجم Google Translator است. واژههای خارج از واژگان موجود نیز به شدت کاهش یافتهاند. |
قیمت |
-
برای اعضای سایت : 100,000 Rial
-
برای دانشجویان عضو انجمن : 20,000 Rial
-
برای اعضای عادی انجمن : 40,000 Rial
|
خرید مقاله
|
|