Paper Title |
Authors |
Conference |
Abstract |
|
PKavosh: A New Parallel Approach to Motif Finding |
Hassan ketabi
Mohammadreza A. Oskoei
|
سمپوزیوم علوم کامپیوتر و مهندسی نرمافزار 2013 |
In networks, motifs are small-connected sub-graphs with higher frequency occurrence than in random networks. It has recently gathered muchattention as a concept to uncover structural design principles of complex biological ... more
In networks, motifs are small-connected sub-graphs with higher frequency occurrence than in random networks. It has recently gathered muchattention as a concept to uncover structural design principles of complex biological networks. Finding motifs in a network is a very challenging and time-consuming process. Several algorithms and improvements have been proposed. One of the best-known tools that can find motifs in a complex network is Kavosh. In this paper, we present a parallel version of Kavosh, named PKavosh, which uses parallel sub-graph enumeration for motif finding. Experimental results show excellent scalability on this problem, achieving a speedup of 7 on 8 processors less
In networks, motifs are small-connected sub-graphs with higher frequency occurrence than in random networks. It has recently gathered muchattention as a concept to uncover structural design principles of complex biological ... more
|
خرید مقاله
|
Approximation and randomized method for Visibility Counting Problem |
Sharareh Alipour
Mohammad Ghodsi
|
سمپوزیوم علوم کامپیوتر و مهندسی نرمافزار 2013 |
For a set of n disjoint line segments S in R2, the visibility counting problem (VCP) is to
preprocess S such that the number of visible segments in S from a ... more
For a set of n disjoint line segments S in R2, the visibility counting problem (VCP) is to
preprocess S such that the number of visible segments in S from a query point p can be computed
quickly. This problem can be solved in logarithmic query time using O(n4) preprocessing time
and space. In this paper, we propose a randomized approximation algorithm for this problem.
The space of our algorithm is O(n4 less
For a set of n disjoint line segments S in R2, the visibility counting problem (VCP) is to
preprocess S such that the number of visible segments in S from a ... more
|
خرید مقاله
|
A Hybrid method for Evaluating Semantic Similarity of Words Based on Ontology |
Fereshteh Nejatpour
Mohammad Hadi Sadredini
Reza Akbari
|
سمپوزیوم علوم کامپیوتر و مهندسی نرمافزار 2013 |
Semantic Similarity is considered as an important component of
many applications such as Natural Language Processing, Information Retrieval,
Text Clustering and etc. This paper presents a new method for evaluating the
semantic similarity ... more
Semantic Similarity is considered as an important component of
many applications such as Natural Language Processing, Information Retrieval,
Text Clustering and etc. This paper presents a new method for evaluating the
semantic similarity of words based on ontology. Ontology development in
many field and its structural features has led to be used as an effective
knowledge-base in proposed method.
In this paper, we introduce a hybrid method that computes similarity considering
both structural features (shortest path between two nodes, neighbors, hyponym
and etc.) and glosses of entity. Finally, we use WordNet and evaluate
this work related to human similarity scores. The results are given to demonstrate
the effectiveness of our approach against related work less
Semantic Similarity is considered as an important component of
many applications such as Natural Language Processing, Information Retrieval,
Text Clustering and etc. This paper presents a new method for evaluating the
semantic similarity ... more
|
خرید مقاله
|
انتخاب ویژگیهای بهینه به منظور کلاسهبندی دادههای سرطانی مبتنی بر الگوریتم بهینهسازی غیر جنسی |
مرضیه محرمخانی
علیرضا خان تیموری
مجید مقدادی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در اين مقاله ايدهی جديدي مبتني بر الگوريتم بهینه سازی غیر جنسی برای جستجوی ويژگيهاي مناسب بر روی دادههای سرطانی ارائه شده است. دادههای سرطانی با ابعاد بالا، شامل تعداد ... more
در اين مقاله ايدهی جديدي مبتني بر الگوريتم بهینه سازی غیر جنسی برای جستجوی ويژگيهاي مناسب بر روی دادههای سرطانی ارائه شده است. دادههای سرطانی با ابعاد بالا، شامل تعداد زیادی ویژگی میباشند که اکثر این ویژگیها غیر مرتبط با مسئلهی مورد نظر هستند. از طرف دیگر در دادههای سرطانی، علاوه بر بالا بودن تعداد ویژگیها، تعداد نمونه-های موجود بسیار اندک است که این موضوع تاثیر نامناسبی بر روی کارایی الگوریتمهای کلاسهبندی دارد. برای حل این مشکل، در این مقاله، الگوریتم جدیدی برای انتخاب ویژگیهای بهینه مبتنی بر الگوریتم بهینه سازی غیر جنسی معرفی شده است. الگوريتم بهینه سازی غیر جنسی يکي از الگوريتمهاي تکاملي الهام گرفته از زندگي موجودات تک جنسی است. این الگوریتم به دلیل عدم نیاز به تنظیم پارامتر و عدم نیاز به عملگر انتخاب در مقایسه با الگوریتم ژنتیک بسیار سریعتر عمل میکند و از افتادن در بهینه محلی اجتناب میکند. الگوریتم ارائه شده بر روی دو مجموعه داده¬ی Colon و 9_Tumor تست شده است. قبل از عمل جستجو، به منظور عدم انتخاب ویژگیهای افزونه از گروه بندی ویژگیها استفاده شده است. پياده سازي روش ارائه شده نشان ميدهدکه الگوریتم ARO در مقایسه با الگوریتم ژنتیک دارای سرعت و دقت بالايي در پيدا کردن نتيجه مطلوب است. less
در اين مقاله ايدهی جديدي مبتني بر الگوريتم بهینه سازی غیر جنسی برای جستجوی ويژگيهاي مناسب بر روی دادههای سرطانی ارائه شده است. دادههای سرطانی با ابعاد بالا، شامل تعداد ... more
|
خرید مقاله
|
یک الگوریتم ممتیک ترکیبی جدید مبتنی بر PSO-SVM برای انتخاب ویژگی |
احسان اسلامی
مهدی افتخاری
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
با پیشرفت سریع تکنولوژی کامپیوتری، پایگاه دادههایی با صدها و هزاران ویژگی در زمینههای شناسایی الگو، دادهکاوی، یادگیری ماشین و غیره به وجود آمده است. به طوری که پردازش مجموعه ... more
با پیشرفت سریع تکنولوژی کامپیوتری، پایگاه دادههایی با صدها و هزاران ویژگی در زمینههای شناسایی الگو، دادهکاوی، یادگیری ماشین و غیره به وجود آمده است. به طوری که پردازش مجموعه دادههای بزرگ، یک کار چالشبرانگیز شده است، بنابراین با انتخاب بهترین مجموعه ویژگی، میتوان به دقت قابل قبولی در پردازش پایگاه داده و همچنین در کاوش روابط معنا¬دار بین ویژگیها رسید. در این مقاله یک مدل ترکیبی جدید ارائه شده است که الگوریتم ازدحام ذرات را با الگوریتم ماشین بردار پشتیبان برای بهبود دقت طبقهبندی و انتخاب مجموعه ویژگی بهینه ترکیب میکند. این مکانیزم بهینهسازی، با ترکیب الگوریتم ازدحام ذرات گسسته و الگوریتم ازدحام ذرات پیوسته بهطور همزمان زیرمجموعه ویژگیهای بهینه را انتخاب و پارامترهای ماشین بردار پشتیبان را تنظیم میکند. در این الگوریتم از دو روش جستجوی محلی برای تنظیم پارامترها و بهبود زیرمجموعه ویژگی استفاده شده است. عملکرد روش پیشنهادی بر روی مجموعه دادههای مختلف ارزیابی شد و نتایج حاصله نشاندهنده کارایی روش مزبور در دادههای با ابعاد معمولی و ابعاد بالا در مقایسه با نسخههای دیگر میباشد. less
با پیشرفت سریع تکنولوژی کامپیوتری، پایگاه دادههایی با صدها و هزاران ویژگی در زمینههای شناسایی الگو، دادهکاوی، یادگیری ماشین و غیره به وجود آمده است. به طوری که پردازش مجموعه ... more
|
خرید مقاله
|
ارائه رویکرد نیمه نظارتی برای شناسایی داده های پرت در شرایط تغییر توزیع داده |
آتوسا سالاری
اشکان سامی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
یکی از حوزههای مهم در داده کاوی و یادگیری ماشین، حوزه شناسایی داده پرت میباشد. روشهای بسیاری برای شناسایی داده پرت ارائه شده که همه آنها از فرض یکسان بودن ... more
یکی از حوزههای مهم در داده کاوی و یادگیری ماشین، حوزه شناسایی داده پرت میباشد. روشهای بسیاری برای شناسایی داده پرت ارائه شده که همه آنها از فرض یکسان بودن توزیع احتمال دادههای تست نسبت به دادههای آموزش پیروی میکنند. اما در بسیاری از برنامه¬های کاربردی واقعی نظیر شناسایی اسپم یا تقلب، تفاوت توزیع دادههای آموزش و تست یک امر رایج است. این حالت به شرایط تغییرتوزیع مجموعه داده معروف است. مطالعات ما نشان میدهد که هیچ یک از روشهای موجود برای شناسایی داده پرت در شرایط تغییر توزیع مجموعه داده عملکرد مناسبی ندارند. مقاله حاضر یک روش نیمه نظارتی سه مرحلهای برای شناسایی داده پرت تحت شرایط تغییر مجموعه داده ارائه مینماید. در مرحله نخست با بکارگیری تکنیک تخمین نسبت چگالی که یک روش وزن دهی بر اساس اهمیت است، وزن نمونه-های آموزش تعیین میشود. سپس با استفاده از یک روال نیمه نظارتی ابتکاری نمونههایی از مجموعه آموزش که نماینگر توزیع واقعی دادههای تست هستند، انتخاب می گردند. در مرحله آخر با استفاده از روش اصلاح شده شناسایی داده پرت بر مبنای داده¬های متعارف، دادههای پرت موجود شناسایی میشوند. نتایج آزمایشات نشان میدهند که از نظر تطبیق با شرایط تغییرتوزیع مجموعه داده روش پیشنهادی عملکرد بهتری نسبت به روشهای موجود دارد less
یکی از حوزههای مهم در داده کاوی و یادگیری ماشین، حوزه شناسایی داده پرت میباشد. روشهای بسیاری برای شناسایی داده پرت ارائه شده که همه آنها از فرض یکسان بودن ... more
|
خرید مقاله
|
طبقهبندی اشیاء مبتنی بر کدگذاری تنک سلسلهمراتبی |
مریم عبدالعلی
محمد رحمتی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
مسئله طبقهبندي اشياء بدنبال تشخيص اشياء در تصاوير و تعيين طبقه آنها ميباشد. اين مسئله يکي از چالش-برانگيزترين مسائل بينايي ماشين محسوب ميشود. با توجه به شباهتهاي بين کدگذاري تنک ... more
مسئله طبقهبندي اشياء بدنبال تشخيص اشياء در تصاوير و تعيين طبقه آنها ميباشد. اين مسئله يکي از چالش-برانگيزترين مسائل بينايي ماشين محسوب ميشود. با توجه به شباهتهاي بين کدگذاري تنک و عملکرد بيولوژيکي مغز انسان و همچنين توانايي کدگذاري تنک در يادگيري مؤلفههاي پايه مشابه با مؤلفههايي که کورتکس بينايي پستانداران استخراج مينمايد، در اين نوشتار بر آنيم تا از قابليتهاي کدگذاري تنک در حل مسئله طبقهبندي بهره ببريم. لذا رويکرد سلسلهمراتبي پيشنهاد شده است که هسته اصلي آن را کدگذاري تنک تشکيل ميدهد و در آن با بهرهگيري از ادغام بيشينهگير وزندار، نقشه برجستگي و گروهبندي محلي هرچه بيشتر کدهاي تنک را نسبت به عمليات هندسي نظير جابه-جايي مکاني مقاوم مينماييم. معماري سه لايه پيشنهاد شده بر روي پايگاهداده Caltech101 مورد ارزيابي قرار گرفتهاند که نتايج (%78.6) نشان از عملکرد موفق رويکرد سلسلهمراتبي پيشنهاد شده نسبت به ساير الگوريتمهاي ارائه شده تا به امروز دارد. less
مسئله طبقهبندي اشياء بدنبال تشخيص اشياء در تصاوير و تعيين طبقه آنها ميباشد. اين مسئله يکي از چالش-برانگيزترين مسائل بينايي ماشين محسوب ميشود. با توجه به شباهتهاي بين کدگذاري تنک ... more
|
خرید مقاله
|
بهبود سرعت پیشپردازش دادههای ورودی الگوریتمهای دستهبندی با استفاده از ترکیب خوشهبندی فازی نوع 2 عمومی و خوشهبندی فازی نوع 1 |
وحید نوری
محمدرضا اکبرزاده توتونچی
علیرضا روحانی منش
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
اخیرا از الگوریتمهای خوشهبندی در زمینه پیشپردازش دادهها برای دستهبندی استفاده میشود که میتواند باعث بهبود کارایی دستهبندی شود. اما همواره سرعت و دقت با یکدیگر در تضاد هستند. الگوریتم ... more
اخیرا از الگوریتمهای خوشهبندی در زمینه پیشپردازش دادهها برای دستهبندی استفاده میشود که میتواند باعث بهبود کارایی دستهبندی شود. اما همواره سرعت و دقت با یکدیگر در تضاد هستند. الگوریتم خوشهبندی فازی نوع1 از الگوریتمهای پرکاربرد در خوشهبندی میباشد که در آن سرعت نسبت به دقت ارجحیت دارد . از طرفی الگوریتم خوشهبندی فازی نوع2 عمومی، یک الگوریتم با دقت بالا و سرعت پایین است و نیز توانایی مقابله با عدم قطعیت موجود در خوشهبندی را دارد. به همین جهت ، در این مقاله ابتدا خوشهبندی فازی نوع1 یکبار اجرا میشود، سپس مراکز بدست آمده از خروجی الگوریتم بعنوان مراکز اولیه به الگوریتم خوشهبندی فازی نوع2 عمومی اعمال میشوند تا با تعداد تکرار کمتری بتواند به حداکثر دقت دست پیدا کند. نتیجهی این کار یک الگوریتم خوشهبندی سریع و با دقت بالا میباشد. افزایش سرعت در افزایش دقت تاثیری نمیگذارد. الگوریتم ارائه شده با الگوریتمهای GT2 FCM، KFGT2FCM و KGT2FCM بر روی 5 مجموعه داده از UCI با هم مقایسه میشوند. این الگوریتم که به اختصار FGT2FCM نامگذاری شده، در فضای نرم افزار MATLAB پیاده سازی شده است. less
اخیرا از الگوریتمهای خوشهبندی در زمینه پیشپردازش دادهها برای دستهبندی استفاده میشود که میتواند باعث بهبود کارایی دستهبندی شود. اما همواره سرعت و دقت با یکدیگر در تضاد هستند. الگوریتم ... more
|
خرید مقاله
|
ارائه هسته چندجملهای متعامد هرمیت با هدف کاهش بردارهای پشتیبان در طبقهبند ماشین بردار پشتیبان (SVM) |
وحید هوشمندمقدم
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
ماشین بردار پشتیبان روش مطلوبی برای طبقهبندی انواع دادههاست، اما مشکل اساسی این روش کاهش چشمگیر سرعت طبقهبندی آن در ازای افزایش ابعاد مسئله و افزایش تعداد نمونهها است. در ... more
ماشین بردار پشتیبان روش مطلوبی برای طبقهبندی انواع دادههاست، اما مشکل اساسی این روش کاهش چشمگیر سرعت طبقهبندی آن در ازای افزایش ابعاد مسئله و افزایش تعداد نمونهها است. در این مقاله تابع هستهای که از چندجملهای متعامد هرمیت مشتق شده، برای ماشین بردار پشتیبان ارائه شده است. این تابع، علاوه بر کاهش تعداد بردارهای پشتیبان که موجب افزایش سرعت خواهد شد، صحت طبقهبندی را افزایش میدهد. نتایج آزمایشها نشان میدهد که تابع پیشنهادی در مقایسه با سایر توابع هسته رایج برای طبقهبندی ماشین بردار پشتیبان، در همهی مجموعه دادههای مورد آزمایش برگرفته از مجموعه داده واقعی UCI، دارای کمترین تعداد بردارهای پشتیبان بوده و به طور کلی بهترین عملکرد را نسبت به دیگر روشها داراست. less
ماشین بردار پشتیبان روش مطلوبی برای طبقهبندی انواع دادههاست، اما مشکل اساسی این روش کاهش چشمگیر سرعت طبقهبندی آن در ازای افزایش ابعاد مسئله و افزایش تعداد نمونهها است. در ... more
|
خرید مقاله
|
دستهبندی مجموعه دادههای ریزآرایه براساس تکنیکهای ترکیبی بهمنظور تشخیص سرطان |
محمد مروت پودنک
علیرضا عصاره
بیتا شادگار
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در سالهای اخیر، فناوری ریزآرایه امکان مانیتورینگ بیان هزاران ژن را بهطور همزمان فراهم آورده است. تحلیلهایی که در زمینه دادههای ریزآرایه صورت گرفته است، بیانگر قدرت این فناوری در ... more
در سالهای اخیر، فناوری ریزآرایه امکان مانیتورینگ بیان هزاران ژن را بهطور همزمان فراهم آورده است. تحلیلهایی که در زمینه دادههای ریزآرایه صورت گرفته است، بیانگر قدرت این فناوری در زمینه تشخیص بسیاری بیماریها از جمله سرطان است. چالشی که در این زمینه مطرح است، تعداد بالای ویژگیها (ژنها) و از طرفی تعداد پایین نمونهها است. تا به امروز تلاشهای متعددی در زمینه انتخاب ژن و سپس دستهبندی دادهها صورت گرفته است که نتایج بدست آمده، بیانگر برتری تکنیکهای ترکیبی در مقابل تکنیکهای منفرد هست. لذا در این پژوهش، پس از ارائه روشی کارآمد در زمینه انتخاب ژن، از تکنیکهای ترکیبی معروف آدابوست، بگینگ و دگینگ جهت کلاسبندی دادهها کمک گرفته شده است. بهعلاوه در بخش بعدی این پژوهش، ادغام چندین تکنیک و در نهایت رأیگیری اکثریت با هدف بهبود نتایج صورت گرفته است. نتایج بدست آمده، بیانگر کارا بودن روش پیشنهادی در مقایسه با الگوریتمهای پایه و همچنین هر یک از تکنیکهای ترکیبی بهصورت منفرد بوده است. less
در سالهای اخیر، فناوری ریزآرایه امکان مانیتورینگ بیان هزاران ژن را بهطور همزمان فراهم آورده است. تحلیلهایی که در زمینه دادههای ریزآرایه صورت گرفته است، بیانگر قدرت این فناوری در ... more
|
خرید مقاله
|