Paper Title |
Authors |
Conference |
Abstract |
|
یک الگوریتم افزایشی- نیمه نظارتی برای حاشیهنویسی چندبرچسبی تصویر به صورت برخط |
الهه طهماسبی امین
فریبرز محمودی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در اين مقاله، یک الگوریتم افزایشی بر مبنای فاکتورگیری نامنفی ماتریس بهمنظور حاشیهنویسی چندبرچسبی تصویر به صورت نیمهنظارتی پیشنهاد شده است. الگوریتم پیشنهادی، با استفاده از روش فاکتورگیری افزایشی نامنفی ... more
در اين مقاله، یک الگوریتم افزایشی بر مبنای فاکتورگیری نامنفی ماتریس بهمنظور حاشیهنویسی چندبرچسبی تصویر به صورت نیمهنظارتی پیشنهاد شده است. الگوریتم پیشنهادی، با استفاده از روش فاکتورگیری افزایشی نامنفی ماتریس به-جای روش عادی فاکتورگیری نامنفی ماتریس، میتواند یک زیرفضای مبتنی بر بخش را به صورت خطی در یک شمای برخط یاد بگیرد. این روش افزایشی قابلیت کاهش بُعد فاکتورگیری نامنفی ماتریس را بدون افزایش بار محاسباتی حفظ کرده و همچنین پیچیدگی مکانی را بدون مقیم کردن دادهی ورودی جدید در حافظه، ثابت نگه میدارد؛ بنابراین میتوان به کمک این روش مجموعه دادههای بزرگ را نیز حاشیهنویسی کرد. نتایج آزمایشات بر روی سه مجموعه دادهی استاندارد نشان میدهد که روش پیشنهادی دقت حاشیهنویسی را بهبود بخشیده و مهمتر از آن پیچیدگی زمانی را مستقل از تعداد نمونهها کاهش داده است. less
در اين مقاله، یک الگوریتم افزایشی بر مبنای فاکتورگیری نامنفی ماتریس بهمنظور حاشیهنویسی چندبرچسبی تصویر به صورت نیمهنظارتی پیشنهاد شده است. الگوریتم پیشنهادی، با استفاده از روش فاکتورگیری افزایشی نامنفی ... more
|
خرید مقاله
|
استفاده از شبکههای باور عمیق برای افزایش مقاومت بازشناسی گفتار در حضور نویز |
محبوبه فراهت
کمال جمشیدی
امیر حسن منجمی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
مدل مخلوط گاوسی و ضرایب فرکانسی مل همواره به عنوان مهمترین روشهای مدلسازی توزیع نمونهها و استخراج ویژگی در شناسایی گفتار مطرح بودهاند. مزیت مدل مخلوط گاوسی در مدلسازی ... more
مدل مخلوط گاوسی و ضرایب فرکانسی مل همواره به عنوان مهمترین روشهای مدلسازی توزیع نمونهها و استخراج ویژگی در شناسایی گفتار مطرح بودهاند. مزیت مدل مخلوط گاوسی در مدلسازی ورودیها با بالاترین دقت و مزیت ضرایب فرکانسی مل در یافتن اطلاعات تمایزدهنده در طیف زمانی کوتاه است. ویژگیهای طیف زمانی کوتاه مقاومت لازم در مقابل نویز را ندارند، از طرفی اما بهکارگیری اطلاعات در بازههای زمانی طولانیتر نیز در مدل مخلوط گاوسی بار محاسباتی بالایی دارد. این مسائل کاهش دقت را در صورت وجود عدم تطابق در شرایط آموزش و آزمون باعث میشود. ترکیب ویژگیهای مختلف و تغییر در مدلسازی نمونههای ورودی از جمله راههای پیشنهادی هستند. در این مقاله از شبکههای باور عمیق برای یافتن ویژگیهای تمایزدهنده از یک طیف زمانی طولانیتر استفاده میشود. در این حالت تبدیلات غیرخطی علاوه بر استخراج ویژگیهای سطح بالاتر و کاهش ابعاد ویژگیهای ورودی، تبدیل فضای ویژگیهای ضرایب فرکانسی مل را منجر میشود که میتوانند در مقابل تغییرات سیگنال ورودی مقاومت لازم را داشته باشند. این ویژگیها در بهبود کارایی مدل مخفی مارکوف استفاده میشوند. روش پیشنهادی بر روی مجموعهای از پرکاربردترین کلمات فارس-دات آزمایش و نتایج آن با پرکاربردترین روش شناسایی گفتار مقایسه شده است. افزایش دقت شناسایی کلمات نشان از کارایی روش پیشنهادی در مقابل تغییرات و نویز دارد. less
مدل مخلوط گاوسی و ضرایب فرکانسی مل همواره به عنوان مهمترین روشهای مدلسازی توزیع نمونهها و استخراج ویژگی در شناسایی گفتار مطرح بودهاند. مزیت مدل مخلوط گاوسی در مدلسازی ... more
|
خرید مقاله
|
تشخیص محدودهی گفتاری در سیگنال صوتی مبتنی بر انتخاب مثبت و سیستمهای ایمنی مصنوعی |
رضا وفاشعار
محمد مهدی همایونپور
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله روش جدیدی برای تشخیص محدودهی گفتار در سیگنال صوتی بر اساس دستهبندی مبتنی بر انتخاب مثبت ارائه شده است. با توجه به مرزهای پیچیدهای که بین دادههای ... more
در این مقاله روش جدیدی برای تشخیص محدودهی گفتار در سیگنال صوتی بر اساس دستهبندی مبتنی بر انتخاب مثبت ارائه شده است. با توجه به مرزهای پیچیدهای که بین دادههای مربوط به نویز و گفتار وجود دارد، استفاده از روشهای دستهبندی معمول برای جداسازی آنها دشوار میباشد. در روش ارائه شده با استفاده از انتخاب مثبت گیرندههایی برای تشخیص دادههای گفتاری و دادههای نویزی ایجاد میشود. روش دستهبندی ارائه شده شبیه یادگیری با نمونه میباشد و قادر به جداسازی کارآمد گفتار از نویز میباشد. در فاز آموزش روش ارائه شده ابتدا گیرندههایی مبتنی بر انتخاب مثبت ایجاد میشوند. این گیرندهها با استفاده از روش انتخاب کلونی بهبود مییابند تا بتوانند فضاهای گفتار و نویز را به طور مناسبی پوشش دهند. روش ارائه شده با چند روش متداول برای تشخیص محدودهی کلمات، در محیطهای مختلف با SNR متفاوت، مقایسه شده است. برای مقایسات از پیکرهی گفتاری TIMIT استفاده شده و عملکرد روشهای مورد مقایسه بر اساس دو معیار نرخ تشخیص موفق و نرخ آلارم اشتباه بررسی شده است. نتایج مقایسات نشان میدهند که روش ارائه شده توانسته است با نرخ آلارم اشتباه پایین به نرخ تشخیص بالایی دست یابد به عنوان مثال در حضور نویز bobble، نرخ آلارم اشتباه بیشتر از 2/0 از روشهای مقایسه شده بهتر بوده، در حالیکه نرخ تشخیص موفق مناسب و بیشتر از 9/0 میباشد. در حضور نویز factory نیز در بعضی موارد بهبودی در حدود 2/0 در نرخ آلارم اشتباه ایجاد شده است. روش پیشنهادی در حضور نویز سفید با نرخ آلارم اشتباه بسیار مناسب و پایین به نرخ تشخیص بالایی دست یافته که در SNR پایین 15/0 بهبود در نرخ تشخیص نیز مشاهده میشود. less
در این مقاله روش جدیدی برای تشخیص محدودهی گفتار در سیگنال صوتی بر اساس دستهبندی مبتنی بر انتخاب مثبت ارائه شده است. با توجه به مرزهای پیچیدهای که بین دادههای ... more
|
خرید مقاله
|
تشخیص الگوهای کلیدی از سیگنال گفتار فارسی بدون استفاده از رونوشت |
هدی سادات جعفری
محمدمهدی همایونپور
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله، هدف تشخیص الگوهای کلیدی در سیگنال گفتار است. الگوهای کلیدی، الگوهایی هستند که نمایندهای از معنای کل گفتار باشند. تشخیص الگوهای کلیدی در سامانههای بازیابی اطلاعات مانند ... more
در این مقاله، هدف تشخیص الگوهای کلیدی در سیگنال گفتار است. الگوهای کلیدی، الگوهایی هستند که نمایندهای از معنای کل گفتار باشند. تشخیص الگوهای کلیدی در سامانههای بازیابی اطلاعات مانند دستهبندی فایلهای صوتی، موتور جستجو، خلاصهسازی، ... کاربرد دارد. در الگوریتم پیشنهادی ابتدا الگوهای تکراری در یک فایل گفتاری با استفاده از الگوریتم S-DTW تشخیص داده میشوند. سپس در مرحله دوم با استفاه از الگوریتم TextRank الگوهای کلیدی استخراج میشوند. روش پیشنهادی یک روش بینظارت بوده و بدون استفاده از سامانه بازشناسی گفتار و داشتن رونوشت، الگوهای کلیدی مستقیماً از روی سیگنال گفتار استخراج میشوند. این الگوریتم برروی تعدادی فایل گفتاری از مجموعه داده فارسدات بزرگ آزمایش شده است. برای مقایسه، از دو سامانهی ایجاز و FarsiSum استفاده شد که کلمات کلیدی را از روی متن تمیز، بدون داشتن خطاهای بازشناسی گفتار استخراج نمودند. سامانهی پیشنهادی در مقایسه با این دو سامانه، نتایج قابل رقابتی را بدست آورده است، در حالی که تنها از سیگنال گفتار برای تشخیص الگوهای کلیدی استفاده کرده است. less
در این مقاله، هدف تشخیص الگوهای کلیدی در سیگنال گفتار است. الگوهای کلیدی، الگوهایی هستند که نمایندهای از معنای کل گفتار باشند. تشخیص الگوهای کلیدی در سامانههای بازیابی اطلاعات مانند ... more
|
خرید مقاله
|
طبقهبندیِ طیفی-مکانی تصاویر ابرطیفی با تخمین توزیع احتمال پسین مبتنی بر کرنل، میدانهای تصادفی مارکوف و یادگیری فعال پیوندهای شکنندۀ اصلاحشده |
مصطفی برهانی
محمدحسن قاسميان يزدی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
این مقاله یک رویکرد نظارت شدۀ برای بهبود دقت طبقهبندیِ طیفی - مکانی تصویر ابرطیفی با ساختار طبقاتی و یادگیری فعال ارائه میدهد. الگوریتم پیشنهادی شامل دو مرحلۀ اصلی میباشد. ... more
این مقاله یک رویکرد نظارت شدۀ برای بهبود دقت طبقهبندیِ طیفی - مکانی تصویر ابرطیفی با ساختار طبقاتی و یادگیری فعال ارائه میدهد. الگوریتم پیشنهادی شامل دو مرحلۀ اصلی میباشد. در ابتدا، از رگرسیون لجستیکِ چندجملهای (MLR) برای استنتاجِ توزیعهای احتمال پسین کلاس استفاده میکنیم. این امر با استفاده از رگرسیون لجستیکِ لاگرانژیِ تقویتی (LORSAL) انجامگرفته است. در واقع، در این مقاله، روش LORSAL با استفاده از کرنلها به حوزه ویژگی توسعهیافته است. سپس، اطلاعات حاصل از مرحلۀ قبل برای طبقهبندیِ طیفی - مکانی تصویر ابرطیفی استفاده میشود. به منظور کاهش هزینۀ دستیابی به مجموعههای آموزشیِ بزرگ، از یادگیری فعالِ مبتنی بر احتمالات پیشینِ MLR استفاده میکنیم. دیگر نوآوری این مقاله، معرفیِ رویکرد نمونهگیری فعال جدیدی است که پیوندهای شکنندۀ اصلاحشده (MBT) نامیده شده و نمونهگیریای بدون بایاس ارائه میکند. همچنین، به منظور دستیابی به حداکثر طبقهبندیِ طیفی - مکانی، پس از یکنواخت سازی توسط میدانهای تصادفی مارکوف از الگوریتم بهینهسازی گسترۀ آلفای عدد صحیح مبتنی بر min – cut استفاده میکنیم. عملکرد رویکرد پیشنهادی، با استفاده از مجموعۀ دادههای طیفیِ واقعی در آزمایشهای مختلف با نتایج سایر روشهای تحلیل تصویر ابرطیفیِ ، مقایسه شده است. less
این مقاله یک رویکرد نظارت شدۀ برای بهبود دقت طبقهبندیِ طیفی - مکانی تصویر ابرطیفی با ساختار طبقاتی و یادگیری فعال ارائه میدهد. الگوریتم پیشنهادی شامل دو مرحلۀ اصلی میباشد. ... more
|
خرید مقاله
|
خلاصهسازی ویدئو در حوزه فشرده استاندارد کدگذاری HEVC |
علیرضا یمقانی
فرزاد زرگری اصل
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله روشی نو در خلاصه سازی ویدئو در حوزه فشرده استاندارد HEVC شرح داده می شود. با استفاده از این استاندارد، ویژگیهای محتوایی فریم ها در حالت ... more
در این مقاله روشی نو در خلاصه سازی ویدئو در حوزه فشرده استاندارد HEVC شرح داده می شود. با استفاده از این استاندارد، ویژگیهای محتوایی فریم ها در حالت فشرده استخراج شده و با استفاده از یک الگو ریتم خوشه بندی، روشی برای خلاصه سازی ارائه گردیده است. اگر چه تحقیقات مختلفی در خصوص خلاصه سازی ویدئویی انجام گردیده است اما بیشتر آن ها، مبتنی بر ویدئو های مبتنی بر حوزه پیکسل بوده که زمان و حافظه زیادی برای کوتاه کردن آن مصرف می گردد. در الگوریتم پیشنهادی، ابتدا ویژگی هیستوگرام نرمال مدهای پیش بینی از ویدئوی فشرده بر اساس HEVC استخراج شده، سپس اشتراک این هیستوگرام به عنوان معیار مشابهت، برای هر دو فریم در ویدئو، محاسبه می گردد. در ادامه یک الگو ریتم خوشه بندی افزایشی، فریم های مشابه را در کلاس های مشخصی جای می دهد. مجموعه نماینده های هر کلاس به عنوان فریم های خلاصه شده در نظر گرفته می شود. نتایج نشان می دهد، الگو ریتم پیشنهادی به دلیل استفاده از استاندارد جدید فشرده سازی به میزان قابل توجهی در تشخیص فریم های مشابه بهتر عمل نموده است و بار محاسباتی کمتری داشته است. less
در این مقاله روشی نو در خلاصه سازی ویدئو در حوزه فشرده استاندارد HEVC شرح داده می شود. با استفاده از این استاندارد، ویژگیهای محتوایی فریم ها در حالت ... more
|
خرید مقاله
|
سیستم شناسایی اثر انگشت با استفاده از گشتاورهای زرنیک و الگوریتم بهبود کیفیت تصویر STFT |
مهدیه کاظمزاده
علی برومندنیا
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
تشخیص هویت از طریق اثرانگشت به دلیل دقت بالا و سادگی، متداول ترین روش شناسایی افراد بر اساس تکنولوژی بیومتریک است. عملکرد یک سیستم تأیید اثر انگشت تا حد زیادی ... more
تشخیص هویت از طریق اثرانگشت به دلیل دقت بالا و سادگی، متداول ترین روش شناسایی افراد بر اساس تکنولوژی بیومتریک است. عملکرد یک سیستم تأیید اثر انگشت تا حد زیادی به کیفیت تصویر اثر انگشت ورودی بستگی دارد. و استخراج ویژگی از تصویر کم کیفیت در یک سیستم شناسایی همیشه با چالش مواجه بوده است.در این مقاله ما از تبدیل فوریه زمانی کوتاه (STFT) برای حذف نویزهای تصویر و رسیدن به یک تصویر با کیفیت بالایی که بتواند جهت و موقعیت نقاط منفرد را با دقت بالاتری بدست آورد استفاده کرده ایم. همچنین یک روش نوین برای استخراج ویژگی از تصویر اثر انگشت با استفاده از گشتاورهای زرنیک ارائه دادیم. در این روش یک بردار ویژگی با طول ثابت ازهر سلول در ناحیه ROI با مرکزیت نقطه مرجع تصویر اثر انگشت، استخراج می کنیم. در این سیستم از مدل شبکه عصبی MLP برای کلاس بندی استفاده شده است. در نهایت با انجام آزمایش بر روی تصاویر پایگاه داده استاندارد، نشان داده می شود که روش پیشنهادی دارای نرخ شناسایی 96.78%و میانگین خطای 3.02 % می باشد که در مقایسه با روشهای مقایسهای عملکرد بهتری دارد. less
تشخیص هویت از طریق اثرانگشت به دلیل دقت بالا و سادگی، متداول ترین روش شناسایی افراد بر اساس تکنولوژی بیومتریک است. عملکرد یک سیستم تأیید اثر انگشت تا حد زیادی ... more
|
خرید مقاله
|
شناسایی چهره با یک روش کاهش بعد بدون اتلاف بر اساس جریمه نگاشت و مبتنی بر مدل ترکیبی تحلیل مؤلفه اصلی احتمالاتی |
سمیه احمدخانی
وصال پیمان ادیبی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله روشی برای شناسایی چهره با استفاده از یک رویکرد کاهش بعد بدون اتلاف ارائه شده است. در این روش به جای نگاشت داده بر یک زیرفضا یا ... more
در این مقاله روشی برای شناسایی چهره با استفاده از یک رویکرد کاهش بعد بدون اتلاف ارائه شده است. در این روش به جای نگاشت داده بر یک زیرفضا یا منیفولد کم بعد که موجب از دست رفتن اطلاعات میشود، فاصله داده از آن زیرفضا یا منیفولد به عنوان جریمه نگاشت در یادگیری یک مدل پیشگو مورد استفاده قرار میگیرد. بدین ترتیب از مزایای کاهش بعد در مدل پیشگو استفاده میشود، و در عین حال جلوی از دست رفتن اطلاعات مفید گرفته میشود. در روش پیشنهادی ابتدا یک منیفولد زیربنایی محلی خطی با استفاده از مدل ترکیبی تحلیل مؤلفه اصلی احتمالاتی از نمونه دادهها به دست میآید. سپس دسته بند ماشین بردار پشتیبان به عنوان مدل پیشگوی مذکور با استفاده از این منیفولد محلی خطی آموزش داده میشود. برای آموزش و ارزیابی روش پیشنهادی، چند پایگاه داده شناخته شده برای چهره مورد استفاده قرار گرفته است. نتایج آزمایش بر روی این پایگاه دادهها نشان میدهد که روش پیشنهادی نسبت به بسیاری روشهای معمول که کاهش بعد را انجام داده و سپس دسته بند را آموزش میدهند، و همچنین نسبت به روش جریمه نگاشت مبتنی بر مدلهای کاهش بعد خطی و غیرخطی دقت بیشتری دارد. less
در این مقاله روشی برای شناسایی چهره با استفاده از یک رویکرد کاهش بعد بدون اتلاف ارائه شده است. در این روش به جای نگاشت داده بر یک زیرفضا یا ... more
|
خرید مقاله
|
شناسایی ارقام دستنویس بر اساس روش کاهش بعد چند هستهای با فرم بسته |
عبداله نظرپور
پیمان ادیبی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله، یک روش جدید کاهش بعد بانظارت با نام کاهش بعد چند هستهای با فرم بسته برای مسئله شناسایی ارقام دستنویس ارائه شده است. ابتدا ویژگیها به کمک ... more
در این مقاله، یک روش جدید کاهش بعد بانظارت با نام کاهش بعد چند هستهای با فرم بسته برای مسئله شناسایی ارقام دستنویس ارائه شده است. ابتدا ویژگیها به کمک روش هیستوگرام گرادیان جهتدار (HOG) از تصاویر استخراج میشوند. پس از آن روش کاهش بعد چند هستهای با فرم بسته سعی در پیدا کردن منیفولد کم بعدی میکند که دقت دستهبندی در آن بیشتر است. این روش از چند تابع هسته استفاده میکند و سعی میکند ارزش (وزن) هر تابع را محاسبه کند و بر اساس ترکیب خطی هستهها به وسیله این ارزشها کاهش بعد را انجام دهد. نوآوری اصلی مدل پیشنهادی ارائه یک فرمولاسیون یادگیری چند هستهای برای کاهش بعد بانظارت است، که بجای روشهای تکرارشونده، پاسخ را به صورت تحلیلی و به فرم بسته بدست میآورد. در فضای کاهش بعد یافته از روش سادهی نزدیکترین همسایگی، برای دستهبندی استفاده شده است. به منظور ارزیابی روش پیشنهادی، چند روش کاهش بعد بانظارت دیگر نیز برای شناسایی ارقام دستنویس به کار گرفته شده است. نتایج آزمایشات بیانگر دقت بالای روش پیشنهادی است. less
در این مقاله، یک روش جدید کاهش بعد بانظارت با نام کاهش بعد چند هستهای با فرم بسته برای مسئله شناسایی ارقام دستنویس ارائه شده است. ابتدا ویژگیها به کمک ... more
|
خرید مقاله
|
نازکسازی کاراکترهای تایپ شده فارسی به کمک یک الگوریتم جدید مبتنی بر عملگرهای ریخت شناسی |
مجید نیکزر
احمدرضا نقشنیلچی
|
نوزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
نازکسازی، یک نوع پیشپردازش روی تصویر کاراکترها است که طی آن عرض تمام بخشهای هر کاراکتر به یک پیکسل کاهش مییابد. در این مقاله روشی برای نازک سازی حروف تایپی ... more
نازکسازی، یک نوع پیشپردازش روی تصویر کاراکترها است که طی آن عرض تمام بخشهای هر کاراکتر به یک پیکسل کاهش مییابد. در این مقاله روشی برای نازک سازی حروف تایپی فارسی ارائه شده است که از طریق تکرارهای متوالی کار نازک سازی را انجام می دهد، این کار به کمک حفر سطوح و حذف پیکسلهای دندانهای انجام میشود. این مقاله قصد دارد با استفاده از الگوریتم های پایه ریخت شناسی به نازک سازی کاراکترهای تایپ شده فارسی به گونهای بپردازد که تشخیص بصری کاراکترهای زبان فارسی را آسان سازد. با توجه به زیاد بودن تعداد نقاط دندانهای در اطراف کاراکترها، این روش از سرعت بالایی برخوردار است. نتایج حاصل از پیاده سازی نشان داد که این روش علاوه بر حفظ پیوستگی، نازکسازی در حد یک پیکسل و بهبود سرعت قادر به صاف نمودن منحنیهای افقی و عمودی در شکل کاراکترها همراه با حفظ دندانۀ حروف میباشد. این موضوع کمک مؤثری به تشخیص بصری کاراکترها میکند. اگرچه کارایی بصری این روش نسبت به روش ژانگ-سوئن اندکی ضعیف تر است، اما زمان مورد نیاز در این روش نسبت به روش ژانگ-سوئن بسیار کمتر است. less
نازکسازی، یک نوع پیشپردازش روی تصویر کاراکترها است که طی آن عرض تمام بخشهای هر کاراکتر به یک پیکسل کاهش مییابد. در این مقاله روشی برای نازک سازی حروف تایپی ... more
|
خرید مقاله
|