پایان نامه داده های گمشده
قسمتی از متن:
معمولاً در پیمایش ها مواردی پیش میآید که برخی از پاسخگویان به برخی از سوالات پاسخ ندهند. پس از وارد کردن دادهها به نرم افزارهای آماری موارد بدون پاسخ به صورت خودکار، گمشده تعریف میشوند. مشکل دادههای گمشده را میتوان به دو حالت کلی تقسیم کرد. حالت اول زمانی است که دادهها به صورتی تصادفی گم شده باشند. مثلاً پاسخگویان برخی سوالات را ندیده باشند و یا پرسشگران یک یا چند سوال را از قلم انداخته باشند. حالت دوم وقتی پیش میآید که پاسخگو با قصد و نیت از پاسخ دادن به سوال یا سوالاتی خودداری ورزیده باشد.
شرایطی که تعمدی در بی پاسخ گذاشتن سوالات وجود داشته باشد، بدترین حالت برای پژوهشگر است. در این حالت هرگونه برخوردی با دادههای گمشده نتایج پیمایش را به سمت اریبی می کشاند. ممکن است پژوهشگری در این حالت ترجیح دهد که پرسشنامههایی را که شامل دادههای گمشده باشند به کلی حذف کند. باید بگویم که این بدترین کاری است که یک پژوهشگر میتواند با این مشکل انجام دهد، زیرا با این کار فقط میزان اریبی را افزایش خواهد داد. مثلاً در یک پیمایش ممکن است افراد طبقه بالای جامعه از گفتن میزان درآمدشان خودداری کرده باشند.
فهرست مطالب
داده های گمشده. 4
شیوه های متفاوت در برخورد با مشکل دادههای گمشده. 4
بی پاسخی و داده های گمشده در آمارگیریهای نمونه ای.. 6
اثر بی پاسخی بر درستی برآوردها 7
آمارگیریهای پستی همراه با مصاحبه با بی پاسخها 9
مثال تشریحی.. 9
تعیین کسر بهینۀ بی پاسخهای آغازین برای زیرنمونه در تلاشهای متمرکز. 12
سازوکارهایی که مقادیر گمشده از آنها ناشی می شود. 13
گمشده کاملاً تصادفی: 14
گمشده تصادفی: 14
مقادیر گمشده غیرقابل چشم پوشی: 14
انواع روشها برای تحلیل داده ها با وجود مقادیر گمشده. 18
روشهای مربوط به مورد کامل : 18
روشهای مبتنی بر جانهی : 19
روشهای تجدید وزن دهی: 19
انواع روش های جانهی.. 20
جانشین کردن میانگین: 20
روش بی درنگ: 21
مثال تشریحی: 22
مدل رگرسیون لوجستیک با وجود مقادیر گمشده تصادفی در متغیر کمکی.. 24
زمینه و هدف: 24
مواد و روش کار: 24
منابع و مآخذ. 30