مشاهده مشخصات مقاله
مرتضی نیشابوری, محمد حسین آریانا, محمدحسین یکتایی
هفدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
انتساب مقوله¬های گرامری به کلمه¬های یک متن، بخشی مهم در سیستم پردازش زبان¬های طبیعی محسوب می شود. پیکرهمتنی که از طریق اطلاعات (pos) part of speech نشانه گذاری شده، معمولاً به عنوان پیش¬نیازی اجتناب ناپذیر در دیگر برنامه¬های کاربردی پیچیده¬تر در حوزه پردازش زبان¬های طبیعی منجملهاستخراج اطلاعات، تجزیه معنایی، ترجمه ماشینی یا تفسیر زمینه¬های معنایی و وارسیکنندههای دستوریمورد استفاده قرار می¬گیرد. در بسیاری از موارد به علت عدم دسترسی به منابع آزمودهشده و استاندارد دستوری و ریختشناسی رایانهای در زبان فارسی به استفاده از نشانهگذارهای آماری بسنده میشود. در این گونه نشانهگذارها برای تشخیص مقوله دستوری واژه های ناشناخته، بدون توجه به ساختار و ماهیت کلمه تنها از روشهای آماری استفاده میشود که طبعا حاصل و نتیجه کارچندان مطلوب نخواهد بود. در این تحقیق، ما به ارائه نشانهگذاری هیبریدی میپردازیم که علاوه بر روش آماری از مزایای روشهای قانون- محور(دستوری) و ریختشناسی واژه ها در زبان فارسی در راستای بهبود نتیجه نهایی بهره میجوید.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال