Paper Title |
Authors |
Conference |
Abstract |
|
تخمین کیفیت پسویرایش به منظور اعتبارسنجی ترجمه کاربران |
حامد باغبانی
هشام فیلی
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در سالهای اخیر، پیشرفت فناوری در زمینه ترجمه ماشینی منجر شده است تا سامانههای مترجم ماشینی در زبانهای مختلف با کیفیتی بهتر از قبل به وجود آیند. به همین دلیل ... more
در سالهای اخیر، پیشرفت فناوری در زمینه ترجمه ماشینی منجر شده است تا سامانههای مترجم ماشینی در زبانهای مختلف با کیفیتی بهتر از قبل به وجود آیند. به همین دلیل ارتباط بین انسان و ماشین بهعنوان یک قسمت مهم از ترجمه، توسعه و اهمیت بیشتری یافته است. یک نمونه از این ارتباط، استفاده از پسویرایش است. پسویرایش به تصحیح و ویرایش متن ترجمهشده توسط سامانه مترجم ماشینی، توسط کاربر گفته میشود. استفاده از ابزارهای پسویرایش ترجمه ماشینی سبب میشود که بتوان از دادههای ویرایش شده توسط کاربر پس از اطمینان نسبت به صحت و کیفیت مناسب، از آنها در جهت بهبود کیفیت مترجم ماشینی نیز بهره برد. در این پژوهش یک روش به منظور اعتبارسنجی ویرایش کاربران ارائه شده است. خصوصیت اصلی روش ارائه شده، قابل اعمال بودن بر انواع ترجمهها و همبستگی بالای آن با معیار Translation Edit Rate به عنوان یک معیار ارزیابی با ناظر است. در این پژوهش ابتدا ویژگیهایی که فقط با داشتن جمله مبدأ و مقصد میتوان به آنها دست یافت را استخراج میکنیم، سپس با بهرهگیری از این ویژگیها به تخمین کیفیت ترجمههای انجام شده یا ویرایش شده توسط کاربران میپردازیم. آزمایشهای انجام شده نشان داده است که استفاده از ویژگیهای استخراج شده از جفت جمله انگلیسی-فارسی ترجمه شده توسط کاربران و اعمال رگرسیون با روش جنگل تصادفی به نتیجهی همبستگی ۰.۹۱ با معیار Translation Edit Rate منجر میشود. less
در سالهای اخیر، پیشرفت فناوری در زمینه ترجمه ماشینی منجر شده است تا سامانههای مترجم ماشینی در زبانهای مختلف با کیفیتی بهتر از قبل به وجود آیند. به همین دلیل ... more
|
خرید مقاله
|
شباهتسنجی معنایی جملات به منظور کشف تقلب در مقالات فارسی |
نیلوفر رنجبر
مهرنوش شمسفرد
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در این مقاله روشی به منظور شباهتسنجی معنایی بین جملات ارائه شده است. این روش با در نظر گرفتن شباهت معنایی و ترتیب به کار رفتن کلمات در جملهها، شباهت ... more
در این مقاله روشی به منظور شباهتسنجی معنایی بین جملات ارائه شده است. این روش با در نظر گرفتن شباهت معنایی و ترتیب به کار رفتن کلمات در جملهها، شباهت بین دو جمله را محاسبه میکند. شباهت معنایی بین کلمات با ترکیب دو روش مبتنی بر روابط بین کلمات در فارسنت و مبتنی بر شبکه عصبی عمیق ، محاسبه میشود. یکی از کاربردهای شباهتسنجی معنایی جملات، کشف تقلب معنایی و هوشمندانه در مقالات علمی است. به همین دلیل در این مقاله پس از ارائه روش شباهتسنجی معنایی بین جملات به کشف تقلب معنایی پرداخته میشود.
روش ارائه شده در این مقاله روی مجموعه دادهای شامل 270 مقاله از انواع مختلف تقلب آزمایش شده است و نتیجه حاصل از این آزمایش بهبود قابل توجهی را در معیار F نسبت به بهترین سیستمهای موجود نشان میدهد.
less
در این مقاله روشی به منظور شباهتسنجی معنایی بین جملات ارائه شده است. این روش با در نظر گرفتن شباهت معنایی و ترتیب به کار رفتن کلمات در جملهها، شباهت ... more
|
خرید مقاله
|
دستهبندی ترافیک شبکههای رایانهای به کمک شبکههای عصبی مصنوعی پیچشی |
محمدصادق صابریان
محمد لطف اللهی
رامین شیرالی حسینزاده
مهدی جعفری سیاوشانی
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
رشد سریع شبکههای رایانهای سبب افزایش اهمیّت ابزارهای تحلیل و بررسی ترافیک این شبکهها شدهاست. پژوهشهای زیادی با هدف ارائه روشی توانمند برای انجام سریع و دقیق این قسم تحلیلها ... more
رشد سریع شبکههای رایانهای سبب افزایش اهمیّت ابزارهای تحلیل و بررسی ترافیک این شبکهها شدهاست. پژوهشهای زیادی با هدف ارائه روشی توانمند برای انجام سریع و دقیق این قسم تحلیلها صورت گرفتهاست که هرکدام از جنبهای به این مسئله پرداختهاند. نقطه اشتراک تمامی این روشها اتّکا آنها به ویژگیهای استخراجشده از ترافیک شبکه توسط یک متخصص است. این وابستگی شدید سبب شده است که این روشها در مقابل ترافیکهای جدید و یا تغییرات در ترافیکهای کنونی، انعطافپذیر نباشند و عملکرد قابلقبولی از خود نشان ندهند. در این پژوهش روشی مبتنی بر پیشرفتهای اخیر در زمینه شبکههای عصبی مصنوعی و یادگیری ژرف برپایه شبکههای عصبی پیچشی به منظور تحلیل ترافیک شبکههای رایانهای و دستهبندی آنها پیشنهاد شدهاست. این روش قادر است دستهبندی ترافیک شبکه را در دو سطح «شناسایی کاربرد» و «رستهبندی ترافیک» بدون دخالت عامل انسانی در استخراج ویژگی با دقت بالاتری نسبت به سایر روشهای موجود انجام دهد. less
رشد سریع شبکههای رایانهای سبب افزایش اهمیّت ابزارهای تحلیل و بررسی ترافیک این شبکهها شدهاست. پژوهشهای زیادی با هدف ارائه روشی توانمند برای انجام سریع و دقیق این قسم تحلیلها ... more
|
خرید مقاله
|
ارائه یک روش مبتنی بر شباهت ساختار خوشههای درون زیرفضایی برای خوشهبندی دادههای با ابعاد بالا |
کاوان فاتحی
منصور فاتح
محسن رضوانی
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
مشکل تنگنای ابعاد در مجموعه دادههای با ابعاد بالا از مسائل مهم در حیطه خوشهبندی دادهها است. در سالهای اخیر برای حل این مشکل، روشهای خوشهبندی زیرفضا مورد توجه ... more
مشکل تنگنای ابعاد در مجموعه دادههای با ابعاد بالا از مسائل مهم در حیطه خوشهبندی دادهها است. در سالهای اخیر برای حل این مشکل، روشهای خوشهبندی زیرفضا مورد توجه بسیاری از محققان قرار گرفته است. هدف اصلی خوشهبندی زیر¬فضایی، یافتن تمام خوشهها در تمام زیرفضاهای ممکن است. مشکل اصلی روشهای پیشین خوشهبندی زیرفضایی، ایجاد تعداد بسیار زیادی زیرفضا است. این مشکل منجر به کاهش کارایی و افزایش زمان اجرای الگوریتمها شده است. در این مقاله روشی کارا مبتنی بر چگالی برای ایجاد بهینه زیرفضاها ارائه شده است. این الگوریتم به صورت پایین به بالا عمل کرده و با استفاده از معیارهای مختلف شباهت، زیرفضاهای مشابه را با تکرار چندین باره الگوریتم پیدا و ترکیب می¬نماید. برای این منظور الگوریتم پیشنهادی در هر تکرار، پس از ترکیب و تشکیل زیرفضاهایی با ابعاد بالاتر، دادههای موجود در این زیرفضاها را دوباره خوشهبندی می¬کند. این خوشهبندی به منظور، بدست آوردن ساختار جدید خوشهها انجام می¬شود. در نهایت الگوریتم پیشنهادی، تمام زیرفضاهای ممکن در دادهها را تشخیص داده و همهی خوشههای ممکن را می¬یابد. برای ارزیابی روش پیشنهادی از مجموعه دادههای مصنوعی و واقعی مختلفی استفاده شده است. روش پیشنهادی در مقایسه با روش های پیشین از دقت و سرعت بهتری برخوردار است. روش پیشنهادی 34 درصد نسبت به الگوریتم CLIQUE و 6 درصد نسبت به DiSH دقت بالاتری دارد. همچنین روش پیشنهادی، برخلاف روشهاش پیشین، توانایی یافتن زیرفضاها در ابعاد مختلف را دارد. less
مشکل تنگنای ابعاد در مجموعه دادههای با ابعاد بالا از مسائل مهم در حیطه خوشهبندی دادهها است. در سالهای اخیر برای حل این مشکل، روشهای خوشهبندی زیرفضا مورد توجه ... more
|
خرید مقاله
|
تعیین شدت قطبیت نظرات فارسی : یک رویکرد نظرکاوی مبتنی بر جنبه |
مرضیه باباعلی
محمدعلی نعمت بخش
افسانه فاطمی
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
تعیین شدت قطبیت نظرات کوتاه (نظرکاوی مبتنی بر جنبه)، یکی از حوزههای پژوهشی مهم در طول چند سال گذشته است. با توجه به تفاوتهای ساختاری، نحوی و معنایی، چالشهای زیادی ... more
تعیین شدت قطبیت نظرات کوتاه (نظرکاوی مبتنی بر جنبه)، یکی از حوزههای پژوهشی مهم در طول چند سال گذشته است. با توجه به تفاوتهای ساختاری، نحوی و معنایی، چالشهای زیادی در این زمینه وجود دارد. از جملهی این چالشها، وجود سه طبقهی اصلی از تعدیل کنندهها یعنی نفیها، تقویت کنندهها و تضعیف کنندهها، میباشد که میتوانند قطبیت و شدت احساس متنهای همجوار خود را تحت تاثیر قرار دهند. یکی دیگر از این چالشها این است که عمدتاً به دلیل کلمات و همرخدادی بسیار محدود در متن، استفاده از دستهبندهای بانظارت (مبتنی بر فرکانس کلمه) برای این نوع متن با مشکل مواجه است و نمیتواند فضای بردار ویژگی و رابطهی بین کلمات و اسناد را به خوبی نشان دهد. در این مقاله، یک مدل بانظارت نظرکاوی مبتنی بر جنبهی 5 ستاره برای طبقهبندی معنایی نظرات به زیر کلاسهای: بسیار ضعیف، ضعیف، متوسط، بسیار خوب و خوب، پیشنهاد میشود. بدین منظور، از دستهبند جنگل تصادفی استفاده شده است. روش پیشنهادی شامل چندین گام پیش¬پردازش و بهبود بردار ویژگی (همگونسازی کلمات نظر هم قطب و شرح قواعدی برای انتقال شدت احساس تعدیل کنندهها به همسایهها) است و بنا به دانش نویسنده، این تحقیق در این زمینه، در زبان فارسی پیشگام میباشد. بررسیهای انجام شده از مقایسهی روش پیشنهادی با دستهبند پایهی جنگل تصادفی و دستهبندها و روشهای دیگر، نشان از بهبود نتایج و موثر بودن مدل پیشنهادی دارد. less
تعیین شدت قطبیت نظرات کوتاه (نظرکاوی مبتنی بر جنبه)، یکی از حوزههای پژوهشی مهم در طول چند سال گذشته است. با توجه به تفاوتهای ساختاری، نحوی و معنایی، چالشهای زیادی ... more
|
خرید مقاله
|
توسعه ساختار طبقهبندی کننده بیز ساده با هدف مدلسازی وابستگی متقابل شرطی ویژگیها |
نیما شیری هرزویلی
ساسان حسینعلی زاده
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
طبقهبندی کننده بیز ساده به دلیل کارایی بالا در پیشبینی و سادگی در ساخت مورد توجه محققین بسیاری قرارگرفته است. بنیان این طبقهبندی کننده بر اساس استقلال شرطی متغیرها (ویژگیها) ... more
طبقهبندی کننده بیز ساده به دلیل کارایی بالا در پیشبینی و سادگی در ساخت مورد توجه محققین بسیاری قرارگرفته است. بنیان این طبقهبندی کننده بر اساس استقلال شرطی متغیرها (ویژگیها) به شرط کلاس است. اگرچه به دلیل وابستگی متقابل بین ویژگیها این فرض در کاربردهای واقعی این طبقهبندی کننده صادق نیست. از این رو، در این مقاله از مفهوم متغیرهای پنهان برای ارائه مدلی تحت عنوان "طبقهبندی کننده بیز ساده آمیخته با متغیر پنهان (MLNB)" به منظور کاهش فرض استقلال شرطی و مدلسازی ویژگیها ارائه شده است. الگوریتم امید ریاضی- بیشینه (EM) به منظور تخمین پارامترهای مدل استفاده شده است. شبیه سازیها بر روی 5 مجموعه داده از مخزن یادگیری ماشین دانشگاه کالیفورنیا ایرواین نشانگر این است که روش پیشنهادی عملکرد قابل توجهای بر اساس دقت طبقهبندی و معیار F-measure در مقایسه با توسعههای اخیر بیز ساده دارد. less
طبقهبندی کننده بیز ساده به دلیل کارایی بالا در پیشبینی و سادگی در ساخت مورد توجه محققین بسیاری قرارگرفته است. بنیان این طبقهبندی کننده بر اساس استقلال شرطی متغیرها (ویژگیها) ... more
|
خرید مقاله
|
پیشبینی عوارضجانبی داروها با یک سیستم توصیهگر و تحلیل تاثیرگذاری عوارض برهم با استفاده از قوانین وابستگی فازی |
مریم ثابت
محمدرضا پژوهان
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
امروزه موضوعات مرتبط با سلامت و اثراتی که در تمامی ابعاد زندگی فردی و اجتماعی دارد، اهمیت فراوانی یافتهاند. داروها گاهی عوارضی ناخوشایند در بدن فرد به همراه خواهند داشت. ... more
امروزه موضوعات مرتبط با سلامت و اثراتی که در تمامی ابعاد زندگی فردی و اجتماعی دارد، اهمیت فراوانی یافتهاند. داروها گاهی عوارضی ناخوشایند در بدن فرد به همراه خواهند داشت. برای کشف این تاثیرات میبایست آزمایشاتی پرهزینه و زمانبر روی جمعیتی مشخص انجام شود تا بتوان بیان کرد که بعد از مصرف این دارو چه تاثیراتی ممکن است بروز کنند. در همین راستا، روشهای یادگیری ماشین، مبتنی بر همسایگی و یا ترکیبی برای پیش¬بینی عوارض ناشی از مصرف داروها بهکارگرفته شده¬اند که همگی سعی در بهبود این پیش¬بینی¬ها داشته¬اند. در این مقاله یک روش جدید برای پیش¬بینی یکسری از عوارضجانبی با داشتن سایر عوارض در دسترس ارائه شده است. در مدل پیشنهادی با استفاده از این عوارضجانبی، یک ماتریس همبستگی ساخته و به صورت یک گراف وزندار درنظرگرفته می¬شود. پس از آن با به¬کارگیری الگوریتم¬های تشخیص زیرگراف، مدلسازی به ازای گروه-های کمتری از عوارض انجام می¬گیرد. با کمک ماشین بولتزمن محدودشده ماتریس نهایی احتمالات رخداد عوارضجانبی برای داروها تعیین می¬گردد. در نهایت با کمک قوانین وابستگی فازی نتایج به¬گونه¬ای قابل فهم برای فرد خبره ارائه میشود. بررسی نتایج حاصل شده از روش پیشنهادی با کمک نمودار AUPR حاکی از دقت بالاتر مدل پیشنهادی نسبت به روش سیستم توصیهگر مشابه است. less
امروزه موضوعات مرتبط با سلامت و اثراتی که در تمامی ابعاد زندگی فردی و اجتماعی دارد، اهمیت فراوانی یافتهاند. داروها گاهی عوارضی ناخوشایند در بدن فرد به همراه خواهند داشت. ... more
|
خرید مقاله
|
ارائه یک سامانه نوین خلاصهسازی خودکار متن با استفاده از الگوریتم ژنتیک |
محمد مجریان
سید ابوالقاسم میرروشندل
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
رشد انفجاری اطلاعات در سالهای اخیر و ادامه این روند سبب افزایش تمایل کاربران به سامانههای خلاصهسازی خودکار متن برای دستیابی به اطلاعات مورد نیازشان شده است. در این مقاله ... more
رشد انفجاری اطلاعات در سالهای اخیر و ادامه این روند سبب افزایش تمایل کاربران به سامانههای خلاصهسازی خودکار متن برای دستیابی به اطلاعات مورد نیازشان شده است. در این مقاله یک روش نوین برای خلاصهسازی تکسندی بر پایه الگوریتم ژنتیک ارائه شده است که در آن تولید خلاصه استخراجی به یک مسئله بهینهسازی دودویی نگاشت میشود. تابع هدف در سامانه پیشنهادی متشکل از پنج معیار امتیازدهی به جملات است که سه ویژگی آن مبتنی بر ویژگیهای ظاهری و دو ویژگی دیگر مبتنی بر شباهت کسینوسی است. ایده اصلی در تابع هدف، استفاده از شباهت کسینوسی بین جملات خلاصه و جملات متن اصلی و همچنین بین جملات خلاصه و عنوان سند برای افزایش پوشش مطالب مهم متن ورودی است. کاهش افزونگی در خلاصه تولیدی از طریق محاسبه شباهت بین جملات خلاصه با یکدیگر صورت میگیرد. علاوه بر این، جهت تولید خلاصهای با حداکثر طول مشخص تابع تولید جمعیت اولیه و عملگرهای بازتولید در الگوریتم ژنتیک دستخوش اصلاحاتی شده است. ارزیابی سامانه پیشنهادی با استفاده از ابزار استاندارد ROUGE روی مجموعه داده DUC2002 انجام گرفته است. نتایج ارزیابی و مقایسه این سامانه با بهترین روشهای موجود برای خلاصهسازی تکسندی نشاندهنده عملکرد بهتر روش پیشنهادی نسبت به سایر روشها است. less
رشد انفجاری اطلاعات در سالهای اخیر و ادامه این روند سبب افزایش تمایل کاربران به سامانههای خلاصهسازی خودکار متن برای دستیابی به اطلاعات مورد نیازشان شده است. در این مقاله ... more
|
خرید مقاله
|
حاشیه نویسی خودکار تصویر با استفاده از ترکیب نتایج معیارهای مشابهت پرکاربرد |
فاطمه عبداله ئی
امیرمسعود افتخاری مقدم
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
با گسترش روزافزون تکنولوژی و عمومیت یافتن دستگاههای تصویربرداری مانند گوشیهای تلفن، دوربینها، تبلتها و غیره، مدیریت منسجم تصاویر در موضوعات مختلف به چالشی مهم در بازیابی تصویر تبدیل شدهاست. ... more
با گسترش روزافزون تکنولوژی و عمومیت یافتن دستگاههای تصویربرداری مانند گوشیهای تلفن، دوربینها، تبلتها و غیره، مدیریت منسجم تصاویر در موضوعات مختلف به چالشی مهم در بازیابی تصویر تبدیل شدهاست. حاشیهنویسی خودکار تصویر یکی از ابزارهایی است که جستجو بر پایه متن را برای بازیابی تصویر فراهم میکند. در این مقاله، یک رویکرد برای محاسبه عملکرد تعدادی از پرکاربردترین معیارهای مشابهت ارائه شده است که نتیجه حاشیهنویسی با ترکیب نتایج این معیارها بدست خواهد آمد. در این مقاله یک روش جستجوی k نزدیکترین همسایه براساس محتوا ارائه شده است تا نزدیکترین تصاویر از نظر بصری به تصویر مورد جستجو را یافته و از کلمات کلیدی آنها برای حاشیه نویسی تصویر تست استفاده شود. در این کار از Correlogram ، Color Moments و هیستوگرام در فضای رنگی HSV برای استخراج ویژگیهای رنگ و ضرایب تبدیل موجک برای استخراج ویژگیهای بافت در یک بردار ویژگی استفاده شدهاست. پس از استخراج بردار ویژگی نتایج حاشیهنویسی برای هر معیار مشابهت انجام میپذیرد و در انتها با ترکیب و مقایسه نتایج پرتکرارترین کلمات کلیدی برای حاشیهنویسی انتخاب میشود. در اینجا ما از معیارهای مشابهت اقلیدسی، کسینوسی، منهتن و انحراف معیار نسبی استفاده میکنیم. نتایج آزمایشات بر روی دیتاست Corel5k نشان میدهد که معیار مشابهت کسینوسی و انحراف معیار نسبی دقت بهتری نسبت به دو معیار دیگر دارند ولی هر معیار ضعفهایی در تشخیص بردارهای مشابه دارد که با ترکیب خروجی این معیارها نتایج کلی بهتر از نتایج حاصل از استفاده یک معیار مشابهت است. less
با گسترش روزافزون تکنولوژی و عمومیت یافتن دستگاههای تصویربرداری مانند گوشیهای تلفن، دوربینها، تبلتها و غیره، مدیریت منسجم تصاویر در موضوعات مختلف به چالشی مهم در بازیابی تصویر تبدیل شدهاست. ... more
|
خرید مقاله
|
یادگیری احتمالات انتشار برای مدل آبشاری مستقل |
یوسف مشایخی
محمدرضا میبدی
|
بیست و سومین کنفرانس ملی سالانه انجمن کامپیوتر ایران |
در سالهای اخیر شبکههای اجتماعی محبوبیت بالایی میان کاربران اینترنت یافته است و به همین دلیل مطالعات زیادی در زمینه تحلیل شبکههای اجتماعی انجام شده است. یکی از موضوعات مهم ... more
در سالهای اخیر شبکههای اجتماعی محبوبیت بالایی میان کاربران اینترنت یافته است و به همین دلیل مطالعات زیادی در زمینه تحلیل شبکههای اجتماعی انجام شده است. یکی از موضوعات مهم در تحلیل شبکههای اجتماعی، بررسی انتشار اطلاعات است. در این زمینه فرض میشود که رفتار کاربران تحت تاثیر دیگر کاربران شبکه اجتماعی است. مدلهای مختلفی برای شبیهسازی و تحلیل نحوه انتشار اطلاعات در شبکههای اجتماعی طراحی شده است. در این مقاله، ما به بررسی مساله یادگیری احتمالات انتشار برای مدل آبشاری مستقل میپردازیم. در ابتدا اهمیت موضوع را بیان میکنیم، سپس روش جدیدی برای حل این مساله بر پایه طراحی معادلهای برای تخمین احتمال انتشار هر یال، پیشنهاد میکنیم. همچنین بهبودی بر روش پیشنهادی به هنگام عدم وجود داده کافی برای یادگیری احتمال انتشار، ارائه میگردد. سپس روش پیشنهادی را به کمک چند مجموعه داده ارزیابی کرده و نتایج حاصل از آن را ذکر میکنیم. همچنین روش ارائه شده در این مقاله با دیگر روشها از نظر میانگین خطای مطلق و زمان اجرا مقایسه شده است. less
در سالهای اخیر شبکههای اجتماعی محبوبیت بالایی میان کاربران اینترنت یافته است و به همین دلیل مطالعات زیادی در زمینه تحلیل شبکههای اجتماعی انجام شده است. یکی از موضوعات مهم ... more
|
خرید مقاله
|