عنوان مقاله | نویسنده(ها) | مربوط به کنفرانس | چکیده | خرید مقاله |
---|---|---|---|---|
سید محمد اصغري نكاح, محسن كاهاني, احسان عسگريان
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
نظرات منتشر شده در وب میتوانند به عنوان یک منبع اطلاعاتی مهم در فرایند تصمیمگیری، مورد توجه قرارگیرند. نظرکاوی به عنوان یک حوزه علمی نسبتاً جدید در پردازش زبان طبیعی ، سعی در استخراج دانش از متن نظرات دارد. هدف نظرکاوی این است که حجم انبوهی از نظرات پیرامون یک موجودیت (یک پدیده، یک محصول و ...) توسط ماشین مورد بررسی قرار گیرد و گزارش خلاصه شدهای از احساس بیان شده در آن به کاربر ارائه گردد. برای دستیابی به این هدف تکنیکهای آماری، داده کاوی و پردازش زبان طبیعی مورد استفاده قرار میگیرند. در این پژوهش تلاش شده است که با استفاده از تعریف برچسبهای جدید معنایی برای نظرات و کشف ارتباطات میان این برچسبها و نقشهای نحوی در واحد جمله به دقت بالاتری دست یابیم. همچنین بخش عمدهی پژوهشهای نظرکاوی در زبان انگلیسی صورت گرفته است و در سایر زبانها از جمله فارسی تحقیقات کمی انجام شده و دستاوردهای اندکی بدست آمده است. در این تحقیق نظر کاوی برای متن نظرات در زبان فارسی استفاده شده است، در نتیجه با چالشهای زبان فارسی روبرو شده و تلاش شده است که آنها رفع شوند. در انتها نیز روش پیشنهادی مورد مقایسه و ارزیابی قرار گرفته است. نتایج بدست آمده، حاکی از بهبود دقت روش پیشنهادی نسبت به روشهای مشابه بر روی زبان فارسی است.
|
||
فاطمه مشهدی رجب, مهرنوش شمسفرد
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
اقتباس از آثار علمی دیگران بدون ارجاع صحیح به آنها را دستبرد علمی مینامند که کشف خودکار انواع این سوء استفادهها همواره مورد توجه محققین بوده است. در این مقاله روشی جهت کشف دستبرد علمی ارائه شده است که یک روش مبتنی بر بازیابی اطلاعات است. در این روش ما از یک شیوه بازیابی اطلاعات مبتنی بر خوشهبندی استفاده کردهایم و در آزمایشات نشان دادیم در سیستمهای کشف دستبرد علمی، استفاده از شیوههای بازیابی اطلاعات مبتنی بر خوشهبندی میتواند بسیار کاربردیتر از شیوههای دیگر بازیابی اطلاعات باشد. همچنین در این الگوریتم معیاری برای رتبهبندی اسناد بازیابی شده، ارائه شده است. نتایج آزمایشات نشان میدهد با استفاده از این معیار، سند مورد نظر در 91% موارد در فهرست اسناد رتبهبندی شده با رتبه کمتر از پنج حضور دارد. روش کشف دستبرد علمی پیشنهادی قادر به کشف انواع کپیبرداریهای دقیق و کپیبرداری با تغییرات مانند جابجایی جملات، حذف و درج جملات، جایگزینی کلمات با مترادفهایشان و ترکیب بخشهای کپی شده با یکدیگر است. این سیستم قابل توسعه به انواع کپیبرداریهای هوشمندانه نیز میباشد. در روش پیشنهادی علاوه بر متن اسناد، تصاویر موجود در آنها نیز در رتبهبندی اسناد مؤثر خواهند بود. نتایج ارزیابی سیستم پیشنهادی، نشان میدهد که در این سیستم برای کپیبرداریهای تحت الفظی، میانگین رتبه سند منبع، پنج میباشد.
|
||
هانیه رشیدقلم, فریبرز محمودی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در اين مقاله، روشی بدونناظر و بدون استفاده از فایل سوابق کاربران، جهت حل "مسئله دستهبندی پرسوجو" ارائه میگردد. هدف روش پیشنهادی، نگاشت تمامی اجزای مسئله به مفاهیم بابلنت و حل مسئله بر مبنای این مفاهیم است. بدین منظور سه فاز برون از خط، برخط و دستهبندی در نظر گرفته شده است. فاز برون از خط، فاز نگاشت دستهها به مفاهیمی در بابلنت است در این فاز با استفاده از یک سیستم رفع ابهام، دستهها به مفاهیمی در بابلنت نگاشت میشوند. در فاز برخط، بعد از غنیسازی پرسوجو، پیشپردازشی روی پرسوجوی غنی شده انجام میشود و سپس با استفاده از یک سیستم رفعابهام، به مفاهیمی در بابلنت نگاشت میشود. در فاز نهایی، با استفاده از بهبودهایی روی الگوریتم "احتمال ملاقات"، دستهبندی انجام میشود. جهت ارزیابی، از مجموعه آزمون KDD2005، که معتبرترین مجموعهی موجود میباشد استفاده گردیده است. نتایج حاکی از آن است که روش پیشنهادی نسبت به بهترین روش بدونناظری که از فایل سوابق کاربران استفاده نمیکند، در میزان امتیاز F1، بهبود 3% داشته و نسبت به بهترین روش بدونناظری که از فایل سوابق کاربران استفاده میکند در میزان امتیاز F1، 10% کاهش داشته است.
|
||
ایمان بهروان, سید حمید ظهیری
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
ماشین بردار پشتیبان ( SVM ) یک طبقهبند دو کلاسه است که در سال های اخیر بسیار مورد توجه قرار گرفته است. عملکرد این طبقهبند به مقدار پارامترهای آن از جمله پارامتر C ( Penalty factor ) و پارامتر موجود در کرنل بستگی دارد. همچنین انتخاب تابع کرنل مناسب هم تاثیر بسزایی در بهبود عملکرد آن دارد. در کنار موارد ذکر شده انجام فرایند انتخاب ویژگی نه تنها می تواند باعث بهبود عملکرد طبقهبند مذکور شود بلکه باعث کاهش زمان آموزش و پیچیدگی محاسبات نیز میگردد. در این پژوهش ما از الگوریتم چندهدفهی PSO ( MOPSO ) در بهینهسازی طبقهبند ماشین بردار پشتیبان برای دو تابع هدفِ نرخ بازشناسی و قابلیت اطمینان استفاده کردهایم.
|
||
رضا ایزانلو, احسان شمس داودلی, هادی صدوقی یزدی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله، تخمین حالت سیستم در حضورِ دو گونه نویز غیرگاوسی (مخلوطِ گاوسی و پرت) مورد بررسی قرار گرفته است. فیلتر کالمن یکی از الگوریتمهای تخمین حالت است که در حضور نویز گاوسی، جواب بهینه ارائه میدهد، ولی درصورتیکه نویز غیرگاوسی باشد، بهینه نیست. برای حل این چالش، در یادگیری نظریه اطلاعاتی، معیاری با نام کورآنتروپی ارائهشده است که به دلیل استفاده از مُمانهای مرتبه بالا در سیگنال، نسبت به نویز غیرگاوسی مقاوم است. فیلتر کالمن مبتنی بر معیار بیشینه کورآنتروپی، تنها در یک مقاله مورد بررسی قرارگرفته و یک رابطه غیر بازگشتی، ارائه نموده است که همواره پایدار نیست. در این مقاله، ابتدا روش غیر بازگشتی اخیر را بهبود داده و سپس روش بازگشتی جدیدی را ارائه خواهیم نمود که نسبت به نویز غیرگاوسی مقاوم است. روش ارائهشده دارای دو مزیتِ دقتِ تخمین بالا و زمان اجرای پایین، بهطورهمزمان است. در انتها نیز الگوریتم پیشنهادی را در یک کاربرد رهگیری پیادهسازی میکنیم و برتری آن را در مقایسه با سایر روشهای موجود، نشان میدهیم.
|
||
معصومه حیدری, سید امین حسینی سنو
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
حمله کرم چاله در میان سایر حملات، حملهای شدید در شبکههای سیار موردی است. راهکارهای موجود برای تشخیص حملات کرم چاله شامل packet Leash، SECTOR، DELPHI، RTT-TC، TTM و غیره است. این راهکارها به سخت افزار خاص یا همزمانی نیاز داشته و یا سربار زیادی دارند. در این مقاله روشی برای تشخیص حملات کرم چاله با استفاده از جدول همسایگی خوشهها و اندازهگیری RTTارائه کردهایم. این کار را در دو مرحله انجام میدهیم. مرحله اول، اندازه گیری RTT بین گرههای متوالی و تعیین لینکهای مظنون به کرم چاله و در مرحله دوم، با استفاده از جدول همسایگی خوشهها لینکهای مظنون را با دقت بررسی میکند. الگوریتم پیشنهادی به کمک شبیه ساز NS2 بر روی پروتکل CBRP پیاده سازی و ارزیابی شده است. طبق تحلیلهای انجام شده روش پیشنهادی عملکرد تشخیصی بالایی دارد ضمن اینکه سربار زیادی اضافه نمی کند.
|
||
نگار ریخته گر, منیژه کشتگری
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
شبکههای حسگر بیسیم دارای کاربردهای فراوان در حوزههای گوناگون علم و صنعت هستند. نظارت بر محیط نیز یکی از کاربردهای مهم این گونه شبکهها به شمار میآید. در این مقاله، یک شبکه حسگر بیسیم را به عنوان یک شبکه ناظر بر محیط با هدف تشخیص آتش سوزی جنگل در نظر گرفتیم. با توجه به کاربرد، این گونه شبکهها نسبت به تاخیر انتقال داده بسیار حساس بوده و علاوه بر آن گرههای حسگر نیز دارای منابع محدود انرژی هستند. به دلیل اهمیت این شبکه و قابلیت نظارت بلادرنگ آنها، به شبکهای با ارتباطهای قابل اطمینان، تاخیر کم انتها به انتها و مصرف کارای انرژی نیاز خواهیم داشت. در این مقاله، دو مدل تحلیلی جهت ارزیابی متوسط تاخیر انتها به انتها و مصرف انرژی پیشنهاد خواهیم داد. این مدل با توجه به ترافیک بستههای رسیده و مکانیزمهای پیشگیری از تصادم در یک شبکه حسگر بیسیم چند گامه با استفاده از مدل صفبندی M/M/1 ارائه شده است. جهت ارزیابی و تایید مدل تحلیلی، با استفاده از نرم افزار NS-2 شبکهی خود را شبیهسازی کرده و نتایج حاصل از آن را با نتایج مدل تحلیلی مقایسه کردیم. در نهایت مدل تحلیلی از نظر میزان تاخیر انتها به انتها و مصرف انرژی به میزان 89% و 77% با نتایج شبیهسازی مطابقت دارد.
|
||
اسماعیل نیک ملکی, قاسم میرجلیلی, ابراهیم نیک ملکی, رضا سعادت
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
شبکه توری بیسیم زیرساخت یک تکنولوژی جالب توجه برای فراهم آوردن سرویس ارتباطات پهن باند و فراگیر بیسیم میباشد. با توجه به این کاربرد، مسالهی تاثیر کنترل توان روی افزایش گذردهی یکی از چالشهای پیشرو در این شبکهها به شمار میآید. در این مقاله، ابتدا فرمولبندی مساله کنترل توان و کنترل دسترسی به رسانای انتقال در شبکههای توری بیسیم معرفی میشود. این یک مسئله NP_hard میباشد و افزایش نمایی زمان پاسخگویی را به ازای افزایش تعداد تقاضاها و تعداد گرههای شبکه به دنبال دارد. برای رفع این مشکل یک رویه مبتنی بر روش تجمع ذرات برای کنترل توان و کنترل دسترسی به رسانای انتقال بیسیم ارائه میگردد. شبیهسازی نشان میدهد الگوریتم پیشنهادی در مقایسه با روش بهینه پاسخهای نزدیک به بهینه را در زمان قابل قبول ارائه میکند.
|
||
مهرنوش محبی, زینب موحدی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
امروزه شبکههای اتونومیک به عنوان راهحلی برای پاسخگویی به هزینهها و پیچیدگی روز افزون مدیریت زیرساختهای شبکه مطرح شده است. این معماری قابلیت خودسازماندهی ، خود بهینهسازی ، حفاظت از خود و خودترمیمی را دارد. هدف این مقاله ارائه معماری اتونومیک مبتنی بر سیاست و یادگیری برای شبکههای موردی سیار است تا به واسطه آن بتواند خود را با شرایط ویژه شبکههای موردی سیار تطبیق دهد. با توجه به ماهیت پویای شبکههای بیسیم موردی که در آن هر گره وظیفه مسیریابی را خود به تنهایی انجام میدهد، مدیریت این نوع از شبکهها فرآیندی پیچیده و دشوار است. لذا به دلیل تحرک گرهها مهمترین چالش این نوع از شبکهها در کنار محدودیت منابع رادیویی و انرژی گرهها، مسیریابی با حداقل مصرف منابع است. یافتن ارتباطات محلی با گرههای همسایه با ثبت و حفظ همسایهها میتواند علاوه بر سهولت فرآیند مسیریابی، مصرف انرژی گرهها را نیز بهبود بخشد. در این مقاله سعی شده با ارائه معماری اتونومیک، فرآیند شناسایی همسایهها را با مدیریت پذیر نمودن، بهبود بخشیم. معماری پیشنهادی برروی پروتکل AODV به عنوان نمونه، پیادهسازی شده و در مواردی چون نرخ ارسال بستهها، تاخیر نقطه به نقطه، تعداد بستههای Hello و نرخ بستههای کنترلی بهبود داشته است.
|
||
هادی عواطف رستمی, محمد مهدی اثنی عشری اصفهانی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
بررسيها در تمامي مسايلي که درآن نظارت بر يک مرز مشخص مورد توجه قرارگرفته بر مبناي اين پيشفرض است که احتمال نفوذ در سراسر مسير برابر و بدون تغيير است در حاليکه نميتوان گفت در طبيعت اين فرض همواره صحيح است. اين مقاله به بررسي توانایي و نقش الگوريتم زمانبندي خواب و بيدار براي گرههاي حسگر قرار گرفته بر روي مرز يک ناحيه ميپردازد، به گونهاي که با افزايش احتمال نفوذ از يک نقطه مرز، احتمال بيدار شدن گرهها در آن نقطه افزايش بيابد. در الگوريتم ارائه شده تمامي حسگرها در طول مرز با يک تناوب مشخص زماني بيدار شده و حسگرهاي همسايه خود را بررسي ميکنند سپس با احتمال متفاوتي در نقاط مختلف مرز بيدار ميمانند يا به خواب ميروند. به منظور فراهم ساختن اين تطبيقپذيري، در الگوريتم پيشنهادي از آتاماتاي يادگير استفاده شده است. اين الگوريتم با بگارگيري آتاماتاي يادگير از دیدگاه طول عمر و نیز هوشمندی در افزایش چگالی گرههای فعال بر اساس تغییر روند نفوذها بهبودهاي چشم گيري در مقايسه با روشهای موجود نظیر RIS، LEACH، TDMA و الگوریتم ارائه شده توسط مصطفایی و میبدی (M-M-LA) از خود نشان ميدهد.
|
||
الهام شعبانینیا, پیمان اديبي
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
بازشناسی انسان عبارت است از شناسایی مجدد یک فرد، در مکان های متنوع در مجموعه دید دوربین های مختلف، که تنها براساس ویژگیهای ظاهری آن فرد انجام میشود. این عمل کاری ارزشمند در نظارت ویدیویی است. در این مقاله یک مدل مبتنی بر هیستوگرام برای ظاهر فرد ارائه میشود که در آن اطلاعات قابهای متوالی به شکل یک هیستوگرام توسعه یافته نمایش داده میشوند. در مدل هیستوگرام توسعه یافته هر ستون از هیستوگرام به جای اختیار نمودن مقداری ثابت، معرف تابع توزیع احتمال یک متغیر تصادفی است که این متغیر تصادفی تغییرات ستون در قابهای متوالی را نشان میدهد. در اینجا توزیع احتمال هر ستون، مخلوطی از چند گاوسی در نظر گرفته میشود که پارامترهای آن با استفاده از روش بیشینه سازی امید، به صورت افزایشی یاد گرفته میشود. در ادامه برای مقایسه دوهیستوگرام توسعه یافته، روشی مبتنی بر وزندهی ستونهای هیستوگرام پیشنهاد شده است. در این روش ستونهای مختلف هیستوگرام با توجه به عدم قطعیت خود در تولید نتیجه مشارکت داده میشوند. بدین صورت که به ستونهایی با قطعیت بیشتر، وزن بیشتری انتساب داده میشود. نتایج تجربی بر روی پایگاه های داده مختلف، نشان میدهد که مدل هیستوگرام توسعه یافته پیشنهادی میتواند کارایی مناسبی را در بازشناسی انسان فراهم آورد.
|
||
حسین قیصری, میرحسین دزفولیان
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله روشی جدید برای بهبود کیفیت تصاویر آندوسکوپی به وسیلۀ تعدیل هیستوگرام فازی و توزیع ناهمسانگرد کنتراست ارائه میشود. تصاویر آندوسکوپی موجود در کشورمان از لحاظ نور و کیفیت وضعیت مناسبی ندارند و همین موضوع تبدیل به چالشی جهت تشخیص انواع بیماریهای دستگاه گوارش شده است. برای غلبه بر این مشکلات و کمک به پزشکان برای تشخیص بهتر، در این مقاله یک روش وفقی با استفاده از تعدیل هیستوگرام فازی و توزیع کنتراست ارائه میشود. همچنین در روش پیشنهادی مفهوم جدیدی از توزیع کنتراست بر اساس آنالیز محلی تصاویر آندوسکوپی معرفی میشود. سپس به وسیلۀ انتخاب وفقی پارامتر هدایت که نقشی مهم در توزیع ایفا میکند، توزیع کنتراست به منظور بهبود کیفیت تصاویر آندسکوپی به تصویر اعمال میشود و در نهایت بعد از انتقال به سه فضای رنگ XYZ، YIQ و HSI به کمک روش تعدیل هیستوگرام فازی،تغییرات نامحسوس رنگ نمایانتر میشود. نتایج تجربی نشان میدهد که روش ارائه شده عملکرد قابل توجهی در افزایش قابلیت دیداری تصاویر آندوسکوپی از خود نشان میدهد.
|
||
مرتضی علی احمدی, روح الله دیانت
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله، روشی برای استخراج ویژگی از سیگنال گفتار، ارائه شده است. ایده کلی روش آن است که ساختار و چینش فیلترها در بانک فیلتر استخراج کننده ویژگی، متغیر و انعطاف پذیر باشد؛ درحالیکه الگوریتمهای معمول استخراج ویژگی مانند MFCC، PLP ... ساختاری ثابت دارند. در روش پیشنهادی، ابتدا، پهنای باند فرکانسی به قسمتهای مساوی تقسیم میشود. سپس با تشکیل یک معادله دیوفانیتن و درنظر گرفتن شرایط محدودکننده مناسب و در نهایت با حل این معادله، چینش بهینه بانک فیلتر برمبنای دادههای آموزشی دردسترس، بهدست میآید. این امر موجب میشود که با تغییر دادههای آموزشی، ساختار بانک فیلتر نیز تغییر کند و متناسب با کاربرد موردنظر، تنظیم گردد. نتایج پیاده سازی روی پایگاه داده TIMIT، بیانگر بهبود کارایی الگوریتم پیشنهادی نسبت به روش MFCC میباشد.
|
||
فریبا پاکیزه حاجی یار, هادی صدوقی یزدی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
حداقل میانگین مربعات خطا نقشی ضروری در یادگیری و مقبولیت سیستمهای عصبی ایفا میکند. با این وجود مقدار آنی خطای مدل به تنهایی نمیتواند حداکثر اطلاعات را از صحت مدل تخمین زده شده یا طبقهبندی ساختار دادهها منتقل کند. در این مقاله تعمیمی از تابع هزینه مرسوم حداقل میانگین مربعات خطا معرفی کردهایم که ترم تنظیمکننده آن مبتنی بر حداقل واریانس خطا میباشد. نشان خواهیم داد که این تابع هزینه نیز جوابی شبیه به فرم وینر خواهد داشت و به خاطر ترم تنظیمکننده تابع هزینه جدید نسبت به نویز مقاومتر عمل میکند و شکل دادهها را بهتر در خود لحاظ مینماید. همچنین فرم بازگشتی LMS گونه تابع هزینه معرفی شده را بدست میآوریم تا بتوان از آن به صورت برخط استفاده نمود و سپس به حل انواع کرنلی آن میپردازیم. عملکرد این روشها را با دادههای مختلف در مسئله طبقهبندی بررسی خواهیم نمود.
|
||
احسان ملازاده اول, محمدرضا اکبرزاده توتونچی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله یک روش جدید بر پایه ی ورونوی جهت تعیین معیار دوری و نزدیکی در خوشه بندی انواع داده پیشنهاد شده است. این روش برای تخمین فواصل دور یا نزدیک بطور کاملا خودکار قابل پیاده سازی است و در حوزه ی طبقه بندی داده ها و خوشه بندی بکار گرفته شده است. این امر یک روش خوشه بندی جدید را منجر شده که با تعیین تخمین هایی کاربردی، مفاهیم دوری و نزدیکی طبق خصوصیات محلی هر داده را بیان نموده و وابستگی الگوریتم های خوشه بندی را به پارامتر های ورودی از جمله تعداد خوشه، اندازه شعاعی و شکل آنها حذف کرده است. همچنین با داشتن مقاومت بالا در انواع داده، مزایای روش های مختلف خوشه بندی را به همراه دارد. نتایج حاصله از آزمایشهای مورد نیاز، کاربردی بودن آن را در داده های واقعی نشان می دهد.
|
||
فهیمه پناهنده شهرکی, محمدرضا زارع میرکآباد
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
سرطان سینه یکی از شایعترین انواع سرطان در میان زنان میباشد. پیشبینی زودهنگام این بیماری میتواند کمک قابل توجهی در روند بهبود درمان ایجاد نماید. بنابراین الگوریتمهای متفاوت دادهکاوی و یادگیری ماشین برای پیشبینی خوشخیمی یا بدخیمی تومورهای سرطان سینه مورد استفاده قرار گرفتهاند. یکی از چالشها در این حوزه، توزیع نامتوازن دادهها است، یعنی دادههای کلاس تومورهای بدخیم (کلاس اقلیت) دارای تعدادی به مراتب کمتر از دادههای کلاس دیگر (کلاس اکثریت) هستند. از طرفی الگوریتمهای دادهکاوی اغلب برای کار با دادههای متوازن طراحی شدهاند. این امر ممکن است منجر به برچسبگذاری نادرست دادههای کلاس اقلیت شود. برای برخورد با این مشکل، روشهایی برای برجستهسازی دادههای کلاس اقلیت ارائه شده است. این روشها عموماً از تکرار دادههای کلاس اقلیت و یا حذف دادههای کلاس اکثریت، در راستای توازن دادهها، استفاده میکنند. این مکانیزمها علاوه بر اینکه ماهیت طبیعی دادهها را تغییر میدهد، امکان برچسبگذاری نادرست دادههای کلاس اکثریت را نیز افزایش میدهد. در این مقاله روشی ارائه میشود که با استفاده از الگوریتمهای طبقهبندی ترکیبی، بدون تکرار دادههای کلاس اقلیت و یا حذف دادههای کلاس اکثریت، به برچسبگذاری صحیح دادههای کلاس اقلیت پرداخته شود. الگوریتم ارائه شده با استفاده از خوشهبندی دادهها به سه دسته پرت، خوشآموزش و بدآموزش، ابتدا به شناسایی دادههای پرت میپردازد. سپس به دنبال راهکاری برای برخورد با دادههای بدآموزش (که عمدتاً متعلق به کلاس اقلیت میباشند) میپردازد که با این روند خطای ایجاد شده برای دادههای کلاس اقلیت به صورت چشمگیری کاهش مییابد.
|
||
احمد عبداللهزاده بارفروش
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله روشی برای استخراج نقشهای معنایی بدون در اختیار داشتن پیکرهی حاوی نقشهای معنایی بررسی میشود. با استفاده از پیکرههای موجود، اطلاعاتی که در سطوح پایینتر پردازش متن هستند، مانند اطلاعات نحوی، ریختشناسی و طبقهی معنایی کلمات برای استخراج نقشهای معنایی به کار گرفته میشوند. روش پیشنهادی یک روش مبتنی بر قواعد است که به زیرمجموعهی خاصی از افعال یا اسامی محدود نمیشود. در این روش با استفاده از برچسب نحوی وابستگی، روابط در درخت وابستگی، دستهبندی معنایی اسامی و ویژگیهای ریختشناسی اجزای جمله، سهتاییهای نشاندهندهی نقشهای معنایی استخراج میشوند. نتایج به دست آمده روی زبان فارسی نشان می دهد که ویژگیهای به کار گرفته شده در غیاب پیکرههای حاوی نقش معنایی و یا در حوزههایی که آنها نقص دارند، استخراج نقشهای معنایی را ممکن میسازند. همچنین در زبانهایی که دارای پیکرهی حاوی نقشهای معنایی باشند، در کنار منابع معنایی برای بهبود نتایج، و نیز در تولید پیکرهی نقشهای معنایی قابل بهرهگیری هستند. در انتها روشی برای تبدیل سهتاییهای نقش معنایی به یک مدل گرافی با هدف تجزیهی معنایی متن پیشنهاد میشود.
|
||
تکتم ذوقی, محمد مهدی همایون پور
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
شبکههای عصبی عمیق دارای کاربردهای فراوانی در پردازش گفتار میباشند. در صورتی که این شبکهها به صورت تصادفی مقداردهی اولیه شوند به جواب درست همگرا نخواهند شد، چراکه دارای تعداد پارامترهای فراوانی میباشند. روشهاي متعددي براي پيش-تعلیم شبكههای عصبي عميق مطرح شده است که باعث همگرا شدن شبکه میشوند. پيش-تعلیم شبكههای عصبي ميتواند هم بر مبناي شبكه باور عميق و هم ماشين بولتزمان عميق انجام گيرد. در این مقاله شبکه عصبی عمیق با روش پیش-تعلیم جدیدی که بر مبنای ماشين بولتزمان عميق میباشد، آموزش میبیند. در نهايت خروجي شبكه عصبي پس از پيش-تعلیم توسط روش ارائه شده، برای طبقه بندی واجها مورد استفاده قرار میگیرد. نتايج تجربي بر روي دادگان گفتار تیمیت بیانگر آن است که روش ارائه شده براي كاربردهاي بازشناسي واج مناسب می باشد. همچنین آزمایشات نشان داده است که روش ارائه شده بر مبنای ماشين بولتزمان عميق به كاهش خطاي عمومي سيستم و افزايش كارائي آن كمك ميكند و از طرفی باعث همگرائی سریعتر شبکه عصبی عمیق میشود.
|
||
حامد فکور شندی, هادی ویسی
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
در این مقاله یک روش مبتنی بر یادگیری ماشین با شبکههای عصبی مصنوعی برای محاسبه میزان شباهت معنایی میان دو جمله متنی پیشنهاد شده است و به طور مجزا برای دو زبان انگلیسی و فارسی مورد ارزیابی قرار گرفته است. برای یادگیری شباهت جملات، از یک دادگان موجود برای زبان انگلیسی بهره گرفته شده است که شامل زوج جملاتی هستند که میزان شباهت آنها توسط انسان امتیازدهی شدهاند. برای انجام این کاربرای هر دو جمله، مجموعهای از ویژگیهای آماری، نحوی و معنایی با استفاده از روشهای پردازش زبان طبیعی و همچنین شبکههای واژگانی استخراج شدهاند و میزان شباهت جاکارد ویژگیهای استخراج شده برای دو جمله مختلف توسط یک شبکه عصبی یاد گرفته شده است. در این مقاله، علاوه بر تشابهیابی جملات انگلیسی، این کار به صورت مشابهی برای زبان فارسی نیز انجام شده است که بدین منظور ابتدا با الهام از دادگان انگلیسی موجود، یک دادگان مشابه برای زبان فارسی تهیه شده است. پس از یادگیری شباهت جملات توسط شبکه عصبی، کارایی روش پیشنهادی با استفاده از معیارهای میانگین مربعات خطا و درصد اختلاف بین پاسخ واقعی و پاسخ شبکه، مورد ارزیابی قرار گرفت که بهترین نتیجه برای جملات انگلیسی با این دو معیار، به ترتیب برابر با 0.0375 و %13 و برای جملات فارسی، به ترتیب برابر با 0.0399 و %14 میباشد. نزدیکی نتایج حاصل در دو زبان، بیانگر توان یادگیری روش پیشنهادی در تشابهیابی متون و قابلیت تعمیم آن برای زبانهای مختلف است.
|
||
طوبی فدایی تبریزی, محسن كاهاني, احسان عسگريان
|
بیستمین کنفرانس ملی سالانه انجمن کامپیوتر ایران
|
با توجه به حجم عظیم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمینههای مختلف، پردازش زبانهای طبیعی و تبدیل متون به دانش قابل فهم برای ماشین، مورد توجه قرار گرفته است. با استفاده از سیستمهای استخراج اطلاعات میتوان بطور خودکار پایگاه دانشی ساختیافته از متون ایجاد کرد. در واقع هدف یک سیستم استخراج اطلاعات، استخراج حقایق از متون غیرساختیافته و نمایش آنها در قالبهای ساختیافته مانند سهگانهها میباشد. اگر حقایق در قالب معنایی RDF نگاشت شوند، میتوان اطلاعات مورد نیاز را با ساخت و ارسال پرسوجوهای SPARQL روی پایگاه دانش بدست آورد. در این مقاله، روشی برای استخراج آزاد حقایق از متون زبان فارسی پیشنهاد شده است که در آن استخراج حقایق در سطح جمله و بر اساس تشخیص افعال و روابط وابستگی بین اجزای جمله انجام میشود. راهکار پیشنهادی، حقایق برای تبدیل به قالب RDF آمادهسازی میکند. نتایج حاصل از ارزیابی نشان میدهد که روش پیشنهادی در استخراج حقایق موفق بوده و باعث بهبود دقت و فراخوانی نسبت به سیستمهای موجود میشود.
|