آرشیو مقالات

عنوان مقاله نویسنده(ها) مربوط به کنفرانس چکیده خرید مقاله
سید محمد اصغري نكاح, محسن كاهاني, احسان عسگريان
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
نظرات منتشر شده در وب می‌توانند به عنوان یک منبع اطلاعاتی مهم در فرایند تصمیم‌گیری، مورد توجه قرارگیرند. نظرکاوی به عنوان یک حوزه علمی نسبتاً جدید در پردازش زبان طبیعی ، سعی در استخراج دانش از متن نظرات دارد. هدف نظرکاوی این است که حجم انبوهی از نظرات پیرامون یک موجودیت (یک پدیده، یک محصول و ...) توسط ماشین مورد بررسی قرار گیرد و گزارش خلاصه شده‌ای از احساس بیان شده در آن به کاربر ارائه گردد. برای دستیابی به این هدف تکنیک‌‌های آماری، داده کاوی و پردازش زبان طبیعی مورد استفاده قرار می‌گیرند. در این پژوهش تلاش شده است که با استفاده از تعریف برچسب‌‌های جدید معنایی برای نظرات و کشف ارتباطات میان این برچسب‌‌ها و نقشهای نحوی در واحد جمله به دقت بالاتری دست یابیم. همچنین بخش عمده‌ی پژوهش‌‌های نظرکاوی در زبان انگلیسی صورت گرفته است و در سایر زبان‌ها از جمله فارسی تحقیقات کمی انجام شده و دستاوردهای اندکی بدست آمده است. در این تحقیق نظر کاوی برای متن نظرات در زبان فارسی استفاده شده است، در نتیجه با چالش‌‌های زبان فارسی روبرو شده و تلاش شده است که آن‌ها رفع شوند. در انتها نیز روش پیشنهادی مورد مقایسه و ارزیابی قرار گرفته است. نتایج بدست آمده، حاکی از بهبود دقت روش پیشنهادی نسبت به روش‌های مشابه بر روی زبان فارسی است.
فاطمه مشهدی رجب, مهرنوش شمس‌فرد
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
اقتباس از آثار علمی دیگران بدون ارجاع صحیح به آنها را دستبرد علمی می‌نامند که کشف خودکار انواع این سوء استفاده‌ها‌ همواره مورد توجه محققین بوده است. در این مقاله روشی جهت کشف دستبرد علمی ارائه شده است که یک روش مبتنی بر بازیابی اطلاعات است. در این روش ما از یک شیوه بازیابی اطلاعات مبتنی بر خوشه‌بندی استفاده کرده‌ایم و در آزمایشات نشان دادیم در سیستم‌های کشف دستبرد علمی، استفاده از شیوه‌های بازیابی اطلاعات مبتنی بر خوشه‌بندی می‌تواند بسیار کاربردی‌تر از شیوه‌های دیگر بازیابی اطلاعات باشد. همچنین در این الگوریتم معیاری برای رتبه‌بندی اسناد بازیابی شده، ارائه شده است. نتایج آزمایشات نشان می‌دهد با استفاده از این معیار، سند مورد نظر در 91% موارد در فهرست اسناد رتبه‌بندی شده با رتبه کمتر از پنج حضور دارد. روش کشف دستبرد علمی پیشنهادی قادر به کشف انواع کپی‌برداری‌های دقیق و کپی‌برداری با تغییرات مانند جابجایی جملات، حذف و درج جملات، جایگزینی کلمات با مترادف‌هایشان و ترکیب بخش‌های کپی شده با یکدیگر است. این سیستم قابل توسعه به انواع کپی‌برداری‌های هوشمندانه نیز می‌باشد. در روش پیشنهادی علاوه بر متن اسناد، تصاویر موجود در آنها نیز در رتبه‌بندی اسناد مؤثر خواهند بود. نتایج ارزیابی سیستم پیشنهادی، نشان می‌دهد که در این سیستم برای کپی‌برداری‌های تحت الفظی، میانگین رتبه سند منبع، پنج می‌باشد.
هانیه رشیدقلم, فریبرز محمودی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در اين مقاله، روشی بدون‌ناظر و بدون استفاده از فایل سوابق کاربران، جهت حل "مسئله دسته‌بندی پرس‌وجو" ارائه می‌گردد. هدف روش پیشنهادی، نگاشت تمامی اجزای مسئله به مفاهیم بابل‌نت و حل مسئله بر مبنای این مفاهیم است. بدین منظور سه فاز برون از خط، برخط و دسته‌بندی در نظر گرفته شده است. فاز برون از خط، فاز نگاشت دسته‌ها به مفاهیمی در بابل‌نت است در این فاز با استفاده از یک سیستم رفع ابهام، دسته‌ها به مفاهیمی در بابل‌نت نگاشت می‌شوند. در فاز برخط، بعد از غنی‌سازی پرس‌وجو، پیش‌پردازشی روی پرس‌وجوی غنی ‌شده انجام می‌شود و سپس با استفاده از یک سیستم رفع‌ابهام، به مفاهیمی در بابل‌نت نگاشت می‌شود. در فاز نهایی، با استفاده از بهبودهایی روی الگوریتم "احتمال ملاقات"، دسته‌بندی انجام می‌شود. جهت ارزیابی، از مجموعه آزمون KDD2005، که معتبرترین مجموعه‌ی موجود می‌باشد استفاده گردیده است. نتایج حاکی از آن است که روش پیشنهادی نسبت به بهترین روش بدون‌ناظری که از فایل سوابق کاربران استفاده نمی‌کند، در میزان امتیاز F1، بهبود 3% داشته و نسبت به بهترین روش بدون‌ناظری که از فایل سوابق کاربران استفاده می‌کند در میزان امتیاز F1، 10% کاهش داشته است.
ایمان بهروان, سید حمید ظهیری
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
ماشین بردار پشتیبان ( SVM ) یک طبقه‌بند دو کلاسه است که در سال های اخیر بسیار مورد توجه قرار گرفته است. عملکرد این طبقه‌بند به مقدار پارامترهای آن از جمله پارامتر C ( Penalty factor ) و پارامتر موجود در کرنل بستگی دارد. همچنین انتخاب تابع کرنل مناسب هم تاثیر بسزایی در بهبود عملکرد آن دارد. در کنار موارد ذکر شده انجام فرایند انتخاب ویژگی نه تنها می تواند باعث بهبود عملکرد طبقه‌بند مذکور شود بلکه باعث کاهش زمان آموزش و پیچیدگی محاسبات نیز می‌گردد. در این پژوهش ما از الگوریتم چند‌هدفه‌ی PSO ( MOPSO ) در بهینه‌‎سازی طبقه‌بند ماشین بردار پشتیبان برای دو تابع هدفِ نرخ بازشناسی و قابلیت اطمینان استفاده کرده‌ایم.
رضا ایزانلو, احسان شمس داودلی, هادی صدوقی یزدی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله، تخمین حالت سیستم در حضورِ دو گونه نویز غیرگاوسی (مخلوطِ گاوسی و پرت) مورد بررسی قرار گرفته است. فیلتر کالمن یکی از الگوریتم‌های تخمین حالت است که در حضور نویز گاوسی، جواب بهینه ارائه می‌دهد، ولی درصورتی‌که نویز غیرگاوسی باشد، بهینه نیست. برای حل این چالش، در یادگیری نظریه اطلاعاتی، معیاری با نام کورآنتروپی ارائه‌شده است که به دلیل استفاده از مُمان‌های مرتبه بالا در سیگنال، نسبت به نویز غیرگاوسی مقاوم است. فیلتر کالمن مبتنی بر معیار بیشینه کورآنتروپی، تنها در یک مقاله مورد بررسی قرارگرفته و یک رابطه غیر بازگشتی، ارائه نموده است که همواره پایدار نیست. در این مقاله، ابتدا روش غیر بازگشتی اخیر را بهبود داده و سپس روش بازگشتی جدیدی را ارائه خواهیم نمود که نسبت به نویز غیرگاوسی مقاوم است. روش ارائه‌شده دارای دو مزیتِ دقتِ تخمین بالا و زمان اجرای پایین، به‌طورهمزمان است. در انتها نیز الگوریتم پیشنهادی را در یک کاربرد رهگیری پیاده‌سازی می‌کنیم و برتری آن را در مقایسه با سایر روش‌های موجود، نشان می‌دهیم.
معصومه حیدری, سید امین حسینی سنو
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
حمله کرم چاله در میان سایر حملات، حمله‌‌ای شدید در شبکه‌های سیار موردی است. راهکارهای موجود برای تشخیص حملات کرم چاله شامل packet Leash، SECTOR، DELPHI، RTT-TC، TTM و غیره است. این راهکارها به سخت افزار خاص یا همزمانی نیاز داشته و یا سربار زیادی دارند. در این مقاله روشی برای تشخیص حملات کرم چاله با استفاده از جدول همسایگی خوشه‌ها و اندازه‌گیری RTTارائه کرده‌ایم. این کار را در دو مرحله انجام می‌دهیم. مرحله اول، اندازه گیری RTT بین گره‌های متوالی و تعیین لینک‌های مظنون به کرم چاله و در مرحله دوم، با استفاده از جدول همسایگی خوشه‌ها لینک‌های مظنون را با دقت بررسی می‌کند. الگوریتم پیشنهادی به کمک شبیه ساز NS2 بر روی پروتکل CBRP پیاده سازی و ارزیابی شده است. طبق تحلیل‌های انجام شده روش پیشنهادی عملکرد تشخیصی بالایی دارد ضمن اینکه سربار زیادی اضافه نمی کند.
نگار ریخته گر, منیژه کشتگری
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
شبکه‌های حسگر بی‌سیم دارای کاربردهای فراوان در حوزه‌های گوناگون علم و صنعت هستند. نظارت بر محیط نیز یکی از کاربردهای مهم این گونه شبکه‌ها به شمار می‌آید. در این مقاله، یک شبکه حسگر بی‌سیم را به عنوان یک شبکه ناظر بر محیط با هدف تشخیص آتش‌ سوزی جنگل در نظر گرفتیم. با توجه به کاربرد، این گونه شبکه‌ها نسبت به تاخیر انتقال داده بسیار حساس بوده و علاوه بر آن گره‌های حسگر نیز دارای منابع محدود انرژی هستند. به دلیل اهمیت این شبکه و قابلیت نظارت بلادرنگ آنها، به شبکه‌ای با ارتباط‌های قابل اطمینان، تاخیر کم انتها به انتها و مصرف کارای انرژی نیاز خواهیم داشت. در این مقاله، دو مدل تحلیلی جهت ارزیابی متوسط تاخیر انتها به انتها و مصرف انرژی پیشنهاد خواهیم داد. این مدل با توجه به ترافیک بسته‌های رسیده و مکانیزم‌های پیشگیری از تصادم در یک شبکه حسگر بی‌سیم چند گامه با استفاده از مدل صف‌بندی M/M/1 ارائه شده است. جهت ارزیابی و تایید مدل تحلیلی، با استفاده از نرم افزار NS-2 شبکه‌ی خود را شبیه‌سازی کرده و نتایج حاصل از آن را با نتایج مدل تحلیلی مقایسه کردیم. در نهایت مدل تحلیلی از نظر میزان تاخیر انتها به انتها و مصرف انرژی به میزان 89% و 77% با نتایج شبیه‌سازی مطابقت دارد.
اسماعیل نیک ملکی, قاسم میرجلیلی, ابراهیم نیک ملکی, رضا سعادت
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
شبکه توری بی‌‌‌سیم زیرساخت یک تکنولوژی جالب توجه برای فراهم آوردن سرویس ارتباطات پهن باند و فراگیر بی‌‌‌سیم می‌باشد. با توجه به این کاربرد، مساله‌‌‌ی تاثیر کنترل توان روی افزایش گذردهی یکی از چالش‌‌‌های پیش‌‌‌رو در این شبکه‌‌‌ها به شمار می‌‌‌آید. در این مقاله، ابتدا فرمول‌‌‌بندی مساله‌‌‌ کنترل توان و کنترل دسترسی به رسانای انتقال در شبکه‌‌‌های توری بی‌‌‌سیم معرفی می‌‌‌شود. این یک مسئله NP_hard می‌‌‌باشد و افزایش نمایی زمان پاسخگویی را به ازای افزایش تعداد تقاضاها و تعداد گره‌‌‌های شبکه به دنبال دارد. برای رفع این مشکل یک رویه مبتنی بر روش تجمع ذرات برای کنترل توان و کنترل دسترسی به رسانای انتقال بی‌‌‌سیم ارائه می‌‌‌گردد. شبیه‌‌‌سازی نشان می‌‌‌دهد الگوریتم پیشنهادی در مقایسه با روش بهینه پاسخ‌‌‌های نزدیک به بهینه را در زمان قابل قبول ارائه می‌‌‌کند.
مهرنوش محبی, زینب موحدی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
امروزه شبکه‌های اتونومیک به عنوان راه‌حلی برای پاسخگویی به هزینه‌ها و پیچیدگی روز افزون مدیریت زیرساخت‌های شبکه مطرح شده است. این معماری قابلیت خودسازمان‌دهی ، خود بهینه‌سازی ، حفاظت از خود و خودترمیمی را دارد. هدف این مقاله ارائه معماری اتونومیک مبتنی بر سیاست و یادگیری برای شبکه‌های موردی سیار است تا به واسطه آن بتواند خود را با شرایط ویژه شبکه‌های موردی سیار تطبیق دهد. با توجه به ماهیت پویای شبکه‌های بی‌سیم موردی که در آن هر گره وظیفه مسیریابی را خود به تنهایی انجام می‌دهد، مدیریت این نوع از شبکه‌ها فرآیندی پیچیده و دشوار است. لذا به دلیل تحرک گره‌ها مهمترین چالش این نوع از شبکه‌ها در کنار محدودیت منابع رادیویی و انرژی گره‌ها، مسیریابی با حداقل مصرف منابع است. یافتن ارتباطات محلی با گره‌های همسایه با ثبت و حفظ همسایه‌ها می‌تواند علاوه بر سهولت فرآیند مسیریابی، مصرف انرژی گره‌ها را نیز بهبود بخشد. در این مقاله سعی شده با ارائه معماری اتونومیک، فرآیند شناسایی همسایه‌ها را با مدیریت پذیر نمودن، بهبود بخشیم. معماری پیشنهادی برروی پروتکل AODV به عنوان نمونه، پیاده‌سازی شده و در مواردی چون نرخ ارسال بسته‌ها، تاخیر نقطه به نقطه، تعداد بسته‌های Hello و نرخ بسته‌های کنترلی بهبود داشته است.
هادی عواطف رستمی, محمد مهدی اثنی عشری اصفهانی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
بررسي‌ها در تمامي مسايلي که درآن نظارت بر يک مرز مشخص مورد توجه قرارگرفته بر مبناي اين پيش‌فرض است که احتمال نفوذ در سراسر مسير برابر و بدون تغيير است در حاليکه نمي‌توان گفت در طبيعت اين فرض همواره صحيح است. اين مقاله به بررسي توانایي و نقش الگوريتم زمان‏بندي خواب و بيدار براي گره‏هاي حسگر قرار گرفته بر روي مرز يک ناحيه مي‌پردازد، به گونه‏اي که با افزايش احتمال نفوذ از يک نقطه مرز، احتمال بيدار شدن گره‏ها در آن نقطه افزايش بيابد. در الگوريتم ارائه شده تمامي حسگرها در طول مرز با يک تناوب مشخص زماني بيدار شده و حسگرهاي همسايه خود را بررسي مي‌کنند سپس با احتمال متفاوتي در نقاط مختلف مرز بيدار مي‌مانند يا به خواب مي‌روند. به منظور فراهم ساختن اين تطبيق‏پذيري، در الگوريتم پيشنهادي از آتاماتاي يادگير استفاده شده است. اين الگوريتم با بگارگيري آتاماتاي يادگير از دیدگاه طول عمر و نیز هوشمندی در افزایش چگالی گره‌های فعال بر اساس تغییر روند نفوذها بهبودهاي چشم گيري در مقايسه با روش‏های موجود نظیر RIS، LEACH، TDMA و الگوریتم ارائه شده توسط مصطفایی و میبدی (M-M-LA) از خود نشان مي‌دهد.
الهام شعبانی‌نیا, پیمان اديبي
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
بازشناسی انسان عبارت است از شناسایی مجدد یک فرد، در مکان های متنوع در مجموعه دید دوربین های مختلف، که تنها براساس ویژگی‌های ظاهری آن فرد انجام می‌شود. این عمل کاری ارزشمند در نظارت ویدیویی است. در این مقاله یک مدل مبتنی بر هیستوگرام برای ظاهر فرد ارائه می‌شود که در آن اطلاعات قاب‌های متوالی به شکل یک هیستوگرام توسعه یافته نمایش داده می‌شوند. در مدل هیستوگرام توسعه یافته هر ستون از هیستوگرام به جای اختیار نمودن مقداری ثابت، معرف تابع توزیع احتمال یک متغیر تصادفی است که این متغیر تصادفی تغییرات ستون در قاب‌های متوالی را نشان می‌دهد. در اینجا توزیع احتمال هر ستون، مخلوطی از چند گاوسی در نظر گرفته می‌شود که پارامترهای آن با استفاده از روش بیشینه سازی امید، به صورت افزایشی یاد گرفته می‌شود. در ادامه برای مقایسه دوهیستوگرام توسعه یافته، روشی مبتنی بر وزن‌دهی ستون‌های هیستوگرام پیشنهاد شده است. در این روش ستون‌های مختلف هیستوگرام با توجه به عدم قطعیت خود در تولید نتیجه مشارکت داده می‌شوند. بدین صورت که به ستون‌هایی با قطعیت بیشتر، وزن بیشتری انتساب داده می‌شود. نتایج تجربی بر روی پایگاه های داده مختلف، نشان می‌دهد که مدل هیستوگرام توسعه یافته پیشنهادی می‌تواند کارایی مناسبی را در بازشناسی انسان فراهم آورد.
حسین قیصری, میرحسین دزفولیان
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله روشی جدید برای بهبود کیفیت تصاویر آندوسکوپی به وسیلۀ تعدیل هیستوگرام فازی و توزیع ناهمسانگرد کنتراست ارائه می‌شود. تصاویر آندوسکوپی موجود در کشورمان از لحاظ نور و کیفیت وضعیت مناسبی ندارند و همین موضوع تبدیل به چالشی جهت تشخیص انواع بیماری‌های دستگاه گوارش شده است. برای غلبه بر این مشکلات و کمک به پزشکان برای تشخیص بهتر، در این مقاله یک روش وفقی با استفاده از تعدیل هیستوگرام فازی و توزیع کنتراست ارائه می‌شود. همچنین در روش پیشنهادی مفهوم جدیدی از توزیع کنتراست بر اساس آنالیز محلی تصاویر آندوسکوپی معرفی می‌شود. سپس به وسیلۀ انتخاب وفقی پارامتر هدایت که نقشی مهم در توزیع ایفا می‌کند، توزیع کنتراست به منظور بهبود کیفیت تصاویر آندسکوپی به تصویر اعمال می‌شود و در نهایت بعد از انتقال به سه فضای رنگ XYZ، YIQ و HSI به کمک روش تعدیل هیستوگرام فازی،تغییرات نامحسوس رنگ نمایان‌تر می‌شود. نتایج تجربی نشان می‌دهد که روش ارائه شده عملکرد قابل توجهی در افزایش قابلیت دیداری تصاویر آندوسکوپی از خود نشان می‌دهد.
مرتضی علی احمدی, روح الله دیانت
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله، روشی برای استخراج ویژگی از سیگنال گفتار، ارائه شده است. ایده کلی روش آن است که ساختار و چینش فیلترها در بانک فیلتر استخراج کننده ویژگی، متغیر و انعطاف پذیر باشد؛ درحالی‏که الگوریتم‏های معمول استخراج ویژگی مانند MFCC، PLP ... ساختاری ثابت دارند. در روش پیشنهادی، ابتدا، پهنای باند فرکانسی به قسمت‏های مساوی تقسیم می‏شود. سپس با تشکیل یک معادله دیوفانیتن و درنظر گرفتن شرایط محدودکننده مناسب و در نهایت با حل این معادله، چینش بهینه بانک فیلتر برمبنای داده‏های آموزشی دردسترس، به‎دست می‏آید. این امر موجب می‏شود که با تغییر داده‏های آموزشی، ساختار بانک فیلتر نیز تغییر کند و متناسب با کاربرد موردنظر، تنظیم گردد. نتایج پیاده سازی روی پایگاه داده TIMIT، بیانگر بهبود کارایی الگوریتم پیشنهادی نسبت به روش MFCC می‏باشد.
فریبا پاکیزه حاجی یار, هادی صدوقی یزدی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
حداقل میانگین مربعات خطا نقشی ضروری در یادگیری و مقبولیت سیستم‌های عصبی ایفا می‌کند. با این وجود مقدار آنی خطای مدل به تنهایی نمی‌تواند حداکثر اطلاعات را از صحت مدل تخمین زده شده یا طبقه‌بندی ساختار داده‌ها منتقل کند. در این مقاله تعمیمی از تابع هزینه مرسوم حداقل میانگین مربعات خطا معرفی کرده‌ایم که ترم تنظیم‌کننده آن مبتنی بر حداقل واریانس خطا می‌باشد. نشان خواهیم داد که این تابع هزینه نیز جوابی شبیه به فرم وینر خواهد داشت و به خاطر ترم تنظیم‌کننده تابع هزینه جدید نسبت به نویز مقاوم‌تر عمل می‌کند و شکل داده‌ها را بهتر در خود لحاظ می‌نماید. همچنین فرم بازگشتی LMS گونه تابع هزینه معرفی شده را بدست می‌آوریم تا بتوان از آن به صورت برخط استفاده نمود و سپس به حل انواع کرنلی آن می‌پردازیم. عملکرد این روش‌ها را با داده‌های مختلف در مسئله طبقه‌بندی بررسی خواهیم نمود.
احسان ملازاده اول, محمدرضا اکبرزاده توتونچی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله یک روش جدید بر پایه ی ورونوی جهت تعیین معیار دوری و نزدیکی در خوشه بندی انواع داده پیشنهاد شده است. این روش برای تخمین فواصل دور یا نزدیک بطور کاملا خودکار قابل پیاده سازی است و در حوزه ی طبقه بندی داده ها و خوشه بندی بکار گرفته شده است. این امر یک روش خوشه بندی جدید را منجر شده که با تعیین تخمین هایی کاربردی، مفاهیم دوری و نزدیکی طبق خصوصیات محلی هر داده را بیان نموده و وابستگی الگوریتم های خوشه بندی را به پارامتر های ورودی از جمله تعداد خوشه، اندازه شعاعی و شکل آنها حذف کرده است. همچنین با داشتن مقاومت بالا در انواع داده، مزایای روش های مختلف خوشه بندی را به همراه دارد. نتایج حاصله از آزمایشهای مورد نیاز، کاربردی بودن آن را در داده های واقعی نشان می دهد.
فهیمه پناهنده شهرکی, محمدرضا زارع میرک‌آباد
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
سرطان سینه یکی از شایع‌ترین انواع سرطان در میان زنان می‌باشد. پیش‌بینی زودهنگام این بیماری می‌تواند کمک قابل توجهی در روند بهبود درمان ایجاد ‌نماید. بنابراین الگوریتم‌های متفاوت داده‌کاوی و یادگیری ماشین برای پیش‌بینی خوش‌خیمی یا بدخیمی تومورهای سرطان سینه مورد استفاده قرار گرفته‌اند. یکی از چالش‌ها در این حوزه، توزیع نامتوازن داده‌ها است، یعنی داده‌های کلاس تومورهای بدخیم (کلاس اقلیت) دارای تعدادی به مراتب کمتر از داده‌های کلاس دیگر (کلاس اکثریت) هستند. از طرفی الگوریتم‌های داده‌کاوی اغلب برای کار با داده‌های متوازن طراحی شده‌اند. این امر ممکن است منجر به برچسب‌گذاری نادرست داده‌های کلاس اقلیت ‌شود. برای برخورد با این مشکل، روش‌هایی برای برجسته‌سازی داده‌های کلاس اقلیت ارائه شده است. این روش‌ها عموماً از تکرار داده‌های کلاس اقلیت و یا حذف داده‌های کلاس اکثریت، در راستای توازن داده‌ها، استفاده می‌کنند. این مکانیزم‌ها علاوه بر اینکه ماهیت طبیعی داده‌ها را تغییر می‌دهد، امکان برچسب‌گذاری نادرست داده‌های کلاس اکثریت را نیز افزایش می‌دهد. در این مقاله روشی ارائه می‌شود که با استفاده از الگوریتم‌های طبقه‌بندی ترکیبی، بدون تکرار داده‌های کلاس اقلیت و یا حذف داده‌های کلاس اکثریت، به برچسب‌گذاری صحیح داده‌های کلاس اقلیت پرداخته شود. الگوریتم ارائه شده با استفاده از خوشه‌بندی داده‌ها به سه دسته پرت، خوش‌آموزش و بدآموزش، ابتدا به شناسایی داده‌های پرت می‌پردازد. سپس به دنبال راهکاری برای برخورد با داده‌های بدآموزش (که عمدتاً متعلق به کلاس اقلیت می‌باشند) می‌پردازد که با این روند خطای ایجاد شده برای داده‌های کلاس اقلیت به صورت چشمگیری کاهش می‌یابد.
احمد عبدالله‌زاده بارفروش
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله روشی برای استخراج نقش‌های معنایی بدون در اختیار داشتن پیکره‌ی حاوی نقش‌های معنایی بررسی می‌شود. با استفاده از پیکره‌های موجود، اطلاعاتی که در سطوح پایین‌تر پردازش متن هستند، مانند اطلاعات نحوی، ریخت‌شناسی و طبقه‌ی معنایی کلمات برای استخراج نقش‌های معنایی به کار گرفته می‌شوند. روش پیشنهادی یک روش مبتنی بر قواعد است که به زیرمجموعه‌ی خاصی از افعال یا اسامی محدود نمی‌شود. در این روش با استفاده از برچسب نحوی وابستگی، روابط در درخت وابستگی، دسته‌بندی معنایی اسامی و ویژگی‌های ریخت‌شناسی اجزای جمله، سه‌تایی‌های نشان‌دهنده‌ی نقش‌های معنایی استخراج می‌شوند. نتایج به دست آمده روی زبان فارسی نشان می دهد که ویژگی‌های به کار گرفته شده در غیاب پیکره‌های حاوی نقش معنایی و یا در حوزه‌هایی که آن‌ها نقص دارند، استخراج نقش‌های معنایی را ممکن می‌سازند. همچنین در زبان‌هایی که دارای پیکره‌ی حاوی نقش‌های معنایی باشند، در کنار منابع معنایی برای بهبود نتایج، و نیز در تولید پیکره‌ی نقش‌های معنایی قابل بهره‌گیری هستند. در انتها روشی برای تبدیل سه‌تایی‌های نقش معنایی به یک مدل گرافی با هدف تجزیه‌ی معنایی متن پیشنهاد می‌شود.
تکتم ذوقی, محمد مهدی همایون پور
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
شبکه‌های عصبی عمیق دارای کاربردهای فراوانی در پردازش گفتار می‌باشند. در صورتی که این شبکه‌ها به صورت تصادفی مقداردهی اولیه شوند به جواب درست همگرا نخواهند شد، چراکه دارای تعداد پارامترهای فراوانی می‌باشند. روش‌هاي متعددي براي پيش-تعلیم شبكه‌های عصبي عميق مطرح شده است که باعث همگرا شدن شبکه می‌شوند. پيش-تعلیم شبكه‌های عصبي مي‌تواند هم بر مبناي شبكه باور عميق و هم ماشين بولتزمان عميق انجام گيرد. در این مقاله شبکه عصبی عمیق با روش پیش-تعلیم جدیدی که بر مبنای ماشين بولتزمان عميق می‌باشد، آموزش می‌بیند. در نهايت خروجي شبكه عصبي پس از پيش-تعلیم توسط روش ارائه شده، برای طبقه بندی واج‌ها مورد استفاده قرار می‌گیرد. نتايج تجربي بر روي دادگان گفتار تیمیت بیانگر آن است که روش ارائه شده براي كاربردهاي بازشناسي واج مناسب می باشد. همچنین آزمایشات نشان داده است که روش‌ ارائه شده بر مبنای ماشين بولتزمان عميق به كاهش خطاي عمومي سيستم و افزايش كارائي آن كمك مي‌كند و از طرفی باعث همگرائی سریع‌تر شبکه عصبی عمیق می‌شود.
حامد فکور شندی, هادی ویسی
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
در این مقاله یک روش مبتنی بر یادگیری ماشین با شبکه‌های عصبی مصنوعی برای محاسبه میزان شباهت معنایی میان دو جمله متنی پیشنهاد شده است و به طور مجزا برای دو زبان انگلیسی و فارسی مورد ارزیابی قرار گرفته است. برای یادگیری شباهت جملات، از یک دادگان موجود برای زبان انگلیسی بهره گرفته شده است که شامل زوج جملاتی هستند که میزان شباهت آنها توسط انسان امتیاز‌دهی شده‌اند. برای انجام این کاربرای هر دو جمله، مجموعه‌ای از ویژگی‌های آماری، نحوی و معنایی با استفاده از روش‌های پردازش زبان طبیعی و همچنین شبکه‌های واژگانی استخراج شده‌اند و میزان شباهت جاکارد ویژگی‌های استخراج شده برای دو جمله مختلف توسط یک شبکه عصبی یاد گرفته شده است. در این مقاله، علاوه بر تشابه‌یابی جملات انگلیسی، این کار به صورت مشابهی برای زبان فارسی نیز انجام شده است که بدین منظور ابتدا با الهام از دادگان انگلیسی موجود، یک دادگان مشابه برای زبان فارسی تهیه شده است. پس از یادگیری شباهت جملات توسط شبکه عصبی، کارایی روش پیشنهادی با استفاده از معیارهای میانگین مربعات خطا و درصد اختلاف بین پاسخ واقعی و پاسخ شبکه، مورد ارزیابی قرار گرفت که بهترین نتیجه برای جملات انگلیسی با این دو معیار، به ترتیب برابر با 0.0375 و %13 و برای جملات فارسی، به ترتیب برابر با 0.0399 و %14 می‌باشد. نزدیکی نتایج حاصل در دو زبان، بیانگر توان یادگیری روش پیشنهادی در تشابه‌یابی متون و قابلیت تعمیم آن برای زبان‌های مختلف است.
طوبی فدایی تبریزی, محسن كاهاني, احسان عسگريان
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
با توجه به حجم عظیم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمینه‌های مختلف، پردازش زبان‌های طبیعی و تبدیل متون به دانش قابل فهم برای ماشین، مورد توجه قرار گرفته است. با استفاده از سیستم‌های استخراج اطلاعات می‌توان بطور خودکار پایگاه دانشی ساخت‌یافته از متون ایجاد کرد. در واقع هدف یک سیستم استخراج اطلاعات، استخراج حقایق از متون غیرساخت‌یافته و نمایش آن‌ها در قالب‌های ساخت‌یافته مانند سه‌گانه‌ها می‌باشد. اگر حقایق در قالب معنایی RDF نگاشت شوند، می‌توان اطلاعات مورد نیاز را با ساخت و ارسال پرس‌وجوهای SPARQL روی پایگاه دانش بدست آورد. در این مقاله، روشی برای استخراج آزاد حقایق از متون زبان فارسی پیشنهاد شده است که در آن استخراج حقایق در سطح جمله و بر اساس تشخیص افعال و روابط وابستگی‌ بین اجزای جمله انجام می‌شود. راه‌کار پیشنهادی، حقایق برای تبدیل به قالب RDF آماده‌سازی می‌کند. نتایج حاصل از ارزیابی نشان می‌دهد که روش پیشنهادی در استخراج حقایق موفق بوده و باعث بهبود دقت و فراخوانی نسبت به سیستم‌های موجود می‌شود.
1 100 101 102 103 104 105 106 143