نشانه‏‌گذار هیبریدی کارآ در پردازش زبان فارسی

مشاهده‌ مشخصات مقاله

نشانه‏‌گذار هیبریدی کارآ در پردازش زبان فارسی

مرتضی نیشابوری, محمد حسین آریانا, محمدحسین یکتایی

نویسنده (ها)

هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران ‫

مربوط به کنفرانس

انتساب مقوله¬های گرامری به کلمه¬های یک متن، بخشی مهم در سیستم پردازش زبان¬های طبیعی محسوب می شود. پیکره‏متنی که از طریق اطلاعات (pos) part of speech نشانه گذاری شده، معمولاً به عنوان پیش¬نیازی اجتناب ناپذیر در دیگر برنامه¬های کاربردی پیچیده¬تر در حوزه پردازش زبان¬های طبیعی منجملهاستخراج اطلاعات، تجزیه معنایی، ترجمه ماشینی یا تفسیر زمینه¬های معنایی و وارسی‏کننده‏های دستوریمورد استفاده قرار می¬گیرد. در بسیاری از موارد به علت عدم دسترسی به منابع آزموده‏شده و استاندارد دستوری و ریخت‏شناسی رایانه‏ای در زبان فارسی به استفاده از نشانه‏گذارهای آماری بسنده می‏شود. در این گونه نشانه‏گذارها برای تشخیص مقوله دستوری واژه های ناشناخته، بدون توجه به ساختار و ماهیت کلمه تنها از روش‏های آماری استفاده می‏شود که طبعا حاصل و نتیجه کارچندان مطلوب نخواهد بود. در این تحقیق، ما به ارائه نشانه‏گذاری هیبریدی می‏پردازیم که علاوه بر روش آماری از مزایای روش‏های قانون- محور(دستوری) و ریخت‏شناسی واژه ها در زبان فارسی در راستای بهبود نتیجه نهایی بهره می‏جوید.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت

خرید مقاله

انجمن کامپیوتر ایران

برای عضویت کلیک کنید