مشاهده مشخصات مقاله
محسن عرب سرخي, هشام فيلي, محمد آزادنيا
دوازدهمین کنفرانس بینالمللی سالانه انجمن کامپیوتر ایران
در اين مقاله به ارائه يک سيستم تصحيح گر خودکار خطاهاي املايي زبان فارسي پرداخته م يشود. اين سيستم ميتواند جهت پس پردازش براي تصحيح خودکار متون حاصل از نرم افزارهاي بازشناسي حروف بصر ي (OCR) و يا تصحيح متون نوشتا ري انسا ني مورد استفاده قرار گيرد. بخشهاي مختلف اين سيستم عبارتند از: لغتنامه زبان فارسي، الگوريتم تشخيص خطاها و الگوريتم تصحيح کلمات خطادار که با استفاده از توابع ابتکاري بخصوصي خطاهاي موجود در متن مدل شده و تصحيح ميگردد. براي تشخيص کلمات غلط از يک لغت نامه که بصورت خودکار توليد م يشود، استفاده شده و پس از آن، مناسبترين کلمه صحيح انتخاب م يگرد د. در انتخاب مناس بترين کلمه صحيح از توابع ابتکاري مختلفي استفاده م يگردد که بر حسب آنکه متن ورودي، تايپي يا حاصل از خروجي نر مافزار بازشناسي حروف بصر ي باشد، تعريف شد هاند. آزمايشات مختلف در اين پژوهش نشان داده است که با استفاده از لغتنامه ي دقيق از کلمات زبان فارسي در دامنه متون مورد بحث ميتوان به نتايج قابل توجهي در تصحيح خطاهاي متني دست يافت.
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال