پایان نامه کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی
چکیده:
در فصل اول، پایان نامه مروری بر پژوهشهای انجام شده توسط محققان و دانشمندا ن طی نیم قرن اخیر دارد و سعی می کند تا روند تکامل خانواده فیلتر کالمن را مورد بررسی قرار دهد. در فصل دوم به معرفی فیلتر کالمن، فیلتر کالمن توسعه یافته و فیلتر کالمن دوگانه می پردازد و روابط آنها و چگونگی استخراج این روابط تشریح می گردد . در فصل سوم موضوع شناسایی سیتمهای خطی و غیر خطی مطرح می گردد و انواع روشهای شناسایی سیستمهای خطی و غیر خطی مورد مطالعه قرار می گیرد . همچنین کاربرد شبکه عصبی در شناسایی سیستمهای غیر خطی و نحوه آموزش و انتخاب ساختار شبکه عصبی تشریح می گردد و در ادامه نحوه آموزش شبکه عصبی انتخاب شده ارائه می گردد . در فصل چهارم نیز به ارائه شبیه سازیهای انجام شده با نرم افزار Matlab 6.5 و مقایسه آنها با یکدیگر پرداخته شده است.
لیست برنامه های نوشته شده نیز در پیوست ۱ ارائه گردیده است.
مقدمه:
موضوع بهبود گفتار با نیاز به افزایش کیف یت عملکرد سیستمهای ارتباطی صوتی در محیط های نویزی ، مطرح گردید . رنج عملکردی وسیعی برای سیستمهای تشخیص گفتار جهت بهبود ارتباط از راه دور در هوانوردی ، صنایع نظامی ، گفتگوهای راه دور و محیط های سلولی وجود دارد . هدف ما نیز در این پایان نامه بهبود کیفیت قابل ملاحظه گفتار یا افزایش قابلیت فهم آن می باشد.
کاربردهای فراوانی از بهبود گفتارهای صوتی تا پیش بینی های اقتصادی و کنترل تطبیقی نیازمند تخمین و مدلسازی دنباله های زمانی نویزی می باشند . از این جمله می توان به بهبود گفتارهای صوتی ، پیش بینی اقتصادی ، مدلسازی ژئو فیزیکی و بسیاری کاربردهای دیگر اشاره کرد. یک دنباله زمانی نویزی می تواند با یک مدل احتمالی که هر دوی اجزای تقریبی و دقیق دینامیک ها را تخمین می زند ، توصیف شود . چنین مدلی می تواند به همراه فیلتر کالمن (یا فیلتر کالمن توسعه یافته) جهت تخمین و پیش بینی سری زمانی از مشاهدات نویزی بکار گیری شود.
فیلتر کالمن یک فیلتر بهینه خطی است که بر روی فضای حالت سیتمهای خطی استاتیکی و دینامیکی اثر گذاشته و یک تخمین بهینه از حالتهای سیستم با استفاده از معادلات بر گشت پذیر و دینامیکی خود در شرایطی که دسترسی به آنها میسر نباشد ارائه می دهد. همچنین این فیلتر می تواند تاثیر کلیه اطلاعات گذشته و ابتدایی سیستم را نیز در تخمین هر لحظه خود لحاظ نماید.
بنابراین با توضیحات ارائه شده در بالا می توان فهمید که جهت بازیابی یک سیکنال صوتی به یک تخمین خوب نیاز است اما موضوع مهم این است که فیلتر کالمن خطی قادر به ارائه تخمین از مدلهای سیستمهای غیر خطی نمی باشد حال آنکه اکثر سیستمهای واقعی که سیستمهای صوتی نیز از این جمله می باشند ماهیت غیر خطی دارند. لذا در این پایان نامه بر آن شدیم تا با مطالعه بر روی فیلتر کالمن توسعه یافته و به کمک شبکه های عصبی بتوانیم موضوع مدلسازی و تخمین سیگنال صوتی را با فرض غیر خطی بودن آن بررسی نماییم.
1- مروری بر پژوهش های پیشین
1-1- فیلتر وینر:
روبرت وینر به همراه نویلسون از دانشگاه MIT امریکا در خلال سالهای ۱۹۴۰ تا ۱۹۴۹ تحقیق گسترده ای را جهت یافتن یک فیلتر بهینه به منظور تخمین حالتهای سیستمهای خطی انجام دادند که نهایتا در سال ۱۹۴۹ منجر به معرفی فیلتر وینر گردید. این فیلتر یک تخمین خطی با حداقل کردن میانگین مربعات خطا (LMMSE) برای سیگنال مشاهده شده ارائه می دهد. اما این فیلتر دارای چند مشکل بود. اول آنکه ما نیازمند تخمینهای علی هستیم و در نتیجه برای تخمین علی بایستی از فیلتر وینر علی استفاده شود در حالیکه فیلتر وینر فقط N مشاهده جدید را جهت تخمین بکارگیری می کرد و در نتیجه ممکن بود اطلاعاتی از سیگنال در مشاهدات گذشته وجود داشته باشد که در این صورت از بین می رفت. دوم آنکه این فیلتر فقط برای نویزهای ثابت با میانگین صفر طراحی شده بود در حالیکه در دنیای واقعیت انواع نویزهای غیر ثابت وجود دارد. سوم آنکه فیلتر وینر جهت ارائه تخمین سیگنال نیاز به چگالی طیفی و تابع خود همبستگی سیگنال دارد که در همه مواقع در دسترس نمی باشد. وچهارم آنکه تخمینهای LMMSE و ML و MAP که جهت محاسبات این فیلتر بکار می روند در هر زمان نیاز به مشاهدات جدید بودند که مستلزم حافظه بالا بود. همه این عوامل محققان را در طی سالهای ۱۹۵۰ تا ۱۹۶۰ به فکر انداخت تا در پی معرفی فیلتری جدید با قابلیت ارائه تخمین خطی بهینه از طریق مینیمم کردن میانگین خطا و عاری از مشکلات فیلتر وینر باشند.