انجمن کامپیوتر ایران

برای عضویت کلیک کنید

مشاهده‌ مشخصات مقاله

تشخیص کدهای تکراری با استفاده از الگوریتم جنگل تصادفی

مهدی آسیابی خوش طلب, ابراهیم خلیل عباسی

نویسنده (ها)

بیست و پنجمین کنفرانس بین‌المللی انجمن کامپیوتر ایران

مربوط به کنفرانس

قطعه کدهای تکراری به هنگام برنامه‌نویسی به صورت خواسته یا ناخواسته ایجاد می‌شوند. وجود کدهای تکراری باعث افزایش هزینه‌های نگهداری، افزایش زمان توسعه و افزایش زمان تصحیح خطاهای کد می‌شود. پیش از این روش¬های مختلفی مانند نشانه-گذاری، گراف وابستگی، درخت نحو انتزاعی برای تشخیص کدهای تکراری پیشنهاد شده است. هدف در این مقاله ارزیابی میزان دقت تشخیص کدهای تکراری با استفاده از الگوریتم‌های یادگیری ماشین است. در مرحله اول، میزان دقت الگوریتم‌های مختلف یادگیری ماشین در تشخیص کدهای تکراری محاسبه شد. در مرحله بعد، الگوریتم جنگل تصادفی اجرا و دقت آن محاسبه گردید. پیش از اجرای الگوریتم¬ها استانداردسازی اولیه مجموعه داده انجام گرفت و همچنین ویژگی¬های کد منبع با استفاده از TF-IDF استخراج گردید. نتایج ارزیابی نشان داد که الگوریتم جنگل تصادفی دارای دقت بیشتری نسبت به سایر الگوریتم‌های یادگیری ماشین اجرا شده در این مقاله است.

چکیده

برای اعضای سایت : ۱٠٠,٠٠٠ ریال
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

قیمت