انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

گزارشی از ساخت نخستین پیكره چند زبانه برای زبان فارسی

بهرنگ قاسمی زاده, سعید رحیمی, مرتضی سالاریان, علی بهاری سلیم

نویسنده (ها)

دوازدهمین کنفرانس بین‌المللی سالانه انجمن کامپیوتر ایران

مربوط به کنفرانس

این مقاله، اولین پیكره فارسی موازی با تعداد زیادی از زبان‌های اروپایی را معرفی می‌نماید. این مقاله، اولین قدم‌ها را برای ساخت منابع اساسی جهت پردازش زبان فارسی معرفی می‌نماید. این مرحله از كار شامل معرفی ویژگی‌های صرفی - نحوی زبان فارسی و رمزنگاری آنها بر پایه مدلEAGLES/MULTEXT و منابع خاصMULTEXT-East می‌باشد. این مقاله پس از معرفی مختصر زبان فارسی، با تاكید بر شیوه نگارش و ویژگی‌های صرفی- نحوی آن، به ارائه یک دسته‌بندی جدید برای مقوله‌های گفتاری فارسی پرداخته و رسم الخطی را جهت ارائه فارسی در محیط دیجیتال ارائه می‌نماید. پس از آن آماری از پیكره ساخته شده ارائه می‌شود. كار صورت گرفته منحصراً توسط افراد داوطلب و بدون هیچگونه پشتیبانی مالی و یا معنوی از سازمان خاص صورت گرفته است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت