مشاهده مشخصات مقاله
ارائه روشی برای تخمین مقادیر از دست رفته برای دادگان پزشکی مبتنی بر مقادیر همسایگان در فضای ویژگیهای انتخابی
نویسنده (ها) |
-
حسام عمرانپور
-
فاطمه سلحشور
|
مربوط به کنفرانس |
بیست و پنجمین کنفرانس بینالمللی انجمن کامپیوتر ایران |
چکیده |
پیشبینی دقیق دادههای از دست رفته در داده کاوی همیشه یک مشکل چالش بر انگیزه بوده است. در اغلب روشها برای برطرف کردن این چالش، نمونه از دست رفته را از مجموعه داده حذف و یا با مقادیر پیش فرض جایگزین میکنند، که این کار کیفیت دادههای مجموعه داده را کاهش میدهد. در این مقاله یک مدل پیشبینی با ناظر برای تخمین مقادیر از دست رفته ارائه میشود. در ابتدا با استفاده از روشهای انتخاب ویژگی، ویژگیهای تاثیرگذار را پیدا کرده و مجموعه داده را به فضای جدید میبریم و با استفاده از دستهبند K-NN، نزدیک ترین همسایههای همکلاس هر داده را در فضای ثانویه پیدا میکنیم. با میانگین گیری k همسایه نزدیک همکلاس در فضای ثانویه، مقادیر از دسترفته را در فضای اولیه مجموعه داده تخمین میزنیم. مدل پیشنهادی بر روی مجموعه داده پزشکی از مخزن دادگان UCI پیاده سازی شده است. مدل با روشهای معتبر پیشین مورد ارزیابی و مقایسه قرار گرفته است. نتایج بدست آمده نشان میدهد که دقت مدل پیشنهادی برای دادگان Hepatitis برابر با ۸۵.۹۶% و دادگان Pima Indians Diabetes برابر با %۷۹.۰۴ و دادگان Wisconsin Breast Cancer به ۹۷.۱۴% رسیده است. |
قیمت |
-
برای اعضای سایت : ۱٠٠,٠٠٠ ریال
-
برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
-
برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال
|
خرید مقاله
|
|