فا   |   En
Login
مشاهده‌ مشخصات مقاله

استخراج ویژگی های بلندمدت صوتی برای تخمین سریع ضرایب پیچش فرکانسی

Authors
  • حميدرضا برادران كاشاني
  • ياسر شكفته
  • محمد محسن گودرزي
  • حسن قلي‌پور
  • ايمان صراف رضايي
Conference بیست و یکمین کنفرانس ملی سالانه انجمن کامپیوتر
Abstract روش هنجارسازي طول مجراي صوتيیکی از روش های رایج برای کاهش تاثیرات ناشی از طول‌های مختلف مجرای گفتار گویندگان است. در اين روش بااعمال يك ضريب پيچش فرکانسي روي طيف سيگنال گفتار گويندهاختلاف طول مسير صوتي بين گويندگان مختلف جبران مي‌شود. اما بدست آوردن ضريب پيچش هر گوينده امري با هزينه محاسباتي بالا است. در اين مقاله روشي براي تخمين سريع ضريب پيچش فركانسي در روش هنجارسازي VTLN ارائه شده است. براي اين منظور ابتدا تعدادی مولفه كه وابستگي قابل توجهي به گوينده دارند معرفي شده و سپس با استخراج اطلاعات آماري، تعداد 53 ويژگي از آنها استخراج شده است. سپس با استفاده از روش‌ انتخاب ويژگي مرحله به مرحله 9 ويژگي كه بيشترين تاثير را بر مقدار ضريب پيچش دارند انتخاب می نماییم. در ادامه براي تخمين سريع ضريب پيچش با اين 9 ويژگي، از روش رگرسيون خطي و با در نظر گرفتن عبارات متقابل علاوه بر عبارات تكي استفاده كرديم. نتايج پياده‌سازي نشان داد كه از ميان ويژگي‌هاي به كار رفته، ميانه گام گفتار و امتياز جنسيت بيشترين همبستگي را با ضريب پيچش دارند و وجود آن ها در ميان ويژگي‌ها الزامي است. همچنين تركيب ويژگي‌هاي انتخابي بهترين نتيجه را در بر داشته است.
قیمت
  • برای اعضای سایت : 100,000 Rial
  • برای دانشجویان عضو انجمن : 20,000 Rial
  • برای اعضای عادی انجمن : 40,000 Rial

خرید مقاله