فا   |   En
ورود به سایت
مشاهده‌ مشخصات مقاله

استخراج ویژگی های بلندمدت صوتی برای تخمین سریع ضرایب پیچش فرکانسی

نویسنده (ها)
  • حميدرضا برادران كاشاني
  • ياسر شكفته
  • محمد محسن گودرزي
  • حسن قلي‌پور
  • ايمان صراف رضايي
مربوط به کنفرانس بیست و یکمین کنفرانس ملی سالانه انجمن کامپیوتر
چکیده روش هنجارسازي طول مجراي صوتيیکی از روش های رایج برای کاهش تاثیرات ناشی از طول‌های مختلف مجرای گفتار گویندگان است. در اين روش بااعمال يك ضريب پيچش فرکانسي روي طيف سيگنال گفتار گويندهاختلاف طول مسير صوتي بين گويندگان مختلف جبران مي‌شود. اما بدست آوردن ضريب پيچش هر گوينده امري با هزينه محاسباتي بالا است. در اين مقاله روشي براي تخمين سريع ضريب پيچش فركانسي در روش هنجارسازي VTLN ارائه شده است. براي اين منظور ابتدا تعدادی مولفه كه وابستگي قابل توجهي به گوينده دارند معرفي شده و سپس با استخراج اطلاعات آماري، تعداد 53 ويژگي از آنها استخراج شده است. سپس با استفاده از روش‌ انتخاب ويژگي مرحله به مرحله 9 ويژگي كه بيشترين تاثير را بر مقدار ضريب پيچش دارند انتخاب می نماییم. در ادامه براي تخمين سريع ضريب پيچش با اين 9 ويژگي، از روش رگرسيون خطي و با در نظر گرفتن عبارات متقابل علاوه بر عبارات تكي استفاده كرديم. نتايج پياده‌سازي نشان داد كه از ميان ويژگي‌هاي به كار رفته، ميانه گام گفتار و امتياز جنسيت بيشترين همبستگي را با ضريب پيچش دارند و وجود آن ها در ميان ويژگي‌ها الزامي است. همچنين تركيب ويژگي‌هاي انتخابي بهترين نتيجه را در بر داشته است.
قیمت
  • برای اعضای سایت : ۱٠٠,٠٠٠ ریال
  • برای دانشجویان عضو انجمن : ۲٠,٠٠٠ ریال
  • برای اعضای عادی انجمن : ۴٠,٠٠٠ ریال

خرید مقاله