–62

دانشگاه علامه طباطبایی
مرکز آموزشهای تخصصی آزاد
پایاننامه جهت دریافت درجه کارشناسی ارشد
رشته آمار ریاضی
عنوان:
بررسی بیپاسخی در نمونهگیریها
استاد راهنما :
دکتر محمدرضا صالحی راد
استاد مشاور :
دکتر فرزاد اسکندری
محقق :
مریم حقیری لیمودهی
شهریور 1384
فهرست مطالب
عنوان
صفحه
فصل اول – تعاریف و مفاهیم اولیه 1-1 مقدمه 2
1-2 بیپاسخی 3
1-3 اهمیت بیپاسخی و علل بروز آن 5
1-4 اریبی ناشی از بیپاسخی 8
1-5 سابقهی پژوهش 9
1-6 یک مثال كاربردي 13
1-7 روشهای جبران بیپاسخی 17
1-8 خلاصه و نتیجهگیری 24
فصل دوم – کاهش خطای بیپاسخی با استفاده از روش آمارگیریهای پستی و مصاحبه حضوری (روش هانسن و هورويتز) 2-1 مقدمه 26
2-2 بیپاسخی در نمونهگیری پستی 26
2-3 خلاصه و نتیجهگیری 43
فصل سوم – کاهش خطای بیپاسخی با استفاده از روش پولیتز – سیمونز 3-1 مقدمه 45
3-2 غایبین و حاضرین در مصاحبهها 45
3-3 پیشبینی نمونهای مبتنی بر برآوردهای نااریب از زمانی که پاسخگویان در خانه بودهاند 48
3-4 مباحث نظری حذف مراجعات مکرر 55
3-5 واریانس برآورد نمونهای 64
عنوان
صفحه
3-6 مثال عددی 67
3-7 خلاصه و نتیجهگیری 70
فصل چهارم – کاهش خطای بیپاسخی با استفاده از روش دمینگ 4-1 مقدمه 73
4-2 ملاک طرح بهینه 73
4-3 جمعآوری اطلاعات 76
4-4 مراحل و نتايج مربوط به آن 84
4-5 خلاصه و نتيجهگيري 87
فصل پنجم – راههای پیشگیری و درمان بیپاسخی 5-1 مقدمه 90
5-2 گونهشناسی دادههای گمشده 92
5-2-1 گمشدگی تصادفی و غیرتصادفی 92
5-2-2 تعریفهای بیپاسخی و الگوهای دادههای گمشده 93
5-3 عوامل تعیین کننده بیپاسخی سؤال 99
5-4 پیشگیری 102
5-4-1 شیوه گردآوری دادهها 102
5-4-2 پرسشنامه 103
5-4-3 پاسخگو 105
5-4-4 مصاحبهگر 109
5-4-5 فرآوری دادهها 111

عنوان
صفحه
5-5 درمان 111
5-5-1 دانش لازم از ساختار و الگوهای دادههای گمشده و بیپاسخی 111
5-5-2 روشهای ساده و مؤثر درمان دادههای بیپاسخ 113
5-6 خلاصه و نتیجهگیری 116
مثال 118
منابع 126
پيشگفتار :
با توجه به اهميت صحت داده‌ها و اطلاعات آماري در برنامه‌ريزي‌ها و پيشرفت يك كشور، ضرورت كنترل و اصلاح خطا در بررسي‌هاي نمونه‌اي حائز اهميت است. در این پايان نامه، کاهش خطای غيرنمونهگیری (خطای پاسخ) در بررسیهای آماری از طریق سه روش تقلیل خطاهای ناشی از بیپاسخی در برآورد پارامترها را مورد بحث و بررسی قرار میدهیم و راههای پیشگیری و درمانبیپاسخی نیز شرح داده میشود. شايان ذكر است كه اين روشها مبتني بر فرآيندهاي مختلفنمونهگيرياند و از اينرو مقايسه نتايج آنها با يكديگر ميسر نيست.
زيربناي هر تحقيق آماري، داده‌هاي درست است. عدم استفاده از داده‌ها و اطلاعات نادرست زياني كمتر از استفاده از آنها را دارد و يكي از مشكلات مهم در آمارگيري‌ها، ناتواني در به‌دست آوردن اطلاعات مفيد در مورد اقلام اطلاعاتي پرسشنامه از كليه واحدهاي نمونه است. در يك آمارگيري نمونه‌اي اطلاعات برخي از افراد جامعه كه در نمونه حضور دارند، ثبت مي شود و برخي از واحدها نيز به تعدادي از سؤال‌ها پاسخ نمي‌دهند. در اين آمارگيري‌ها معمولاً اطلاعات جمع آوري شده، كامل نمي‌باشند، به اين صورت كه ممكن است براي تعدادي از واحدهاي نمونه، هيچ اطلاعي به‌دست نيايد و براي واحدهاي ديگر ممكن است فقط براي بعضي از سؤال‌ها، اطلاعاتي كسب شود. اين كمبودها را معمولاً بي‌پاسخي در جمع‌آوري اطلاعات میگويند.
در آمارگيري‌ها عوامل مختلفي باعث بروز خطا مي‌شوند از جمله: درك نادرست مصاحبه‌كننده از دستورالعمل‌هاي طرح آمارگيري، عدم تمايل به شركت در تكميل سؤالات طرح آمارگيري به‌دليل پاسخ‌هاي نادرست، فهرست نادرست آدرس‌ها، نامفهوم بودن سؤالات و… از عوامل خطا محسوب مي‌شوند. خطاها به دو نوع عمده تقسيم مي‌شوند. خطاهايي كه طي فرآيند اندازه‌گيري و يا جمع‌آوري اطلاعات بوجود مي‌آیند (خطاهاي غيرنمونه‌گيري) و نوع ديگر خطاهايي هستند كه به‌دلیل برقراري ارتباط مستقيم تنها با بخشي از جمعيت بوجود مي‌آیند (خطاهاي نمونه‌گيري). خطاهاي نمونه‌گيري فقط در آمارگيريهای نمونه‌اي ديده مي‌شود و خطاهاي غيرنمونه‌گيري در سرشماري‌ها و همچنین آمارگيري‌هاي نمونه‌اي مشاهده مي‌شوند.
در زمينه شناخت و رفع خطاهاي نمونه‌گيري كتب و مقالات فراواني تدوين شده است و مي‌توان گفت كه يكي از منابع عمده خطا در بررسي‌ها كه خطاهاي غيرنمونه‌گيري مي‌باشد تا حدودي به دست فراموشي سپرده شده است و اكثر محققان آمارگيري‌هاي نمونه‌اي، بر اين باورند كه خطاي بي‌پاسخي كه به‌عنوان يكي از منابع خطاهاي غيرنمونه‌گيري است، مسئله‌اي اساسي و روبه رشد است. لذا در اين رساله به بررسی، شناخت و رفع خطاهاي غيرنمونه‌گيري در زمينه بي‌پاسخي كه به‌عنوان يكي از منابع خطاهاي غيرنمونه‌گيري است، میپردازیم. همچنین براي حذف اريبي ناشي از داده‌هاي ناقص، روش‌هايي ارايه میدهیم و راهكارهايي براي اصلاح برآوردگرهاي ناشي از بي‌پاسخي به‌دست میآوريم.
1-1 مقدمه
همانطور که گفتیم، یکی از خطاهای مهم در بررسیهای آماری، خطای ناشی از بیپاسخی است. تمام محققین تلاش میکنند تا حد ممکن این خطا به حداقل مقدار تقلیل یابد. تاکنون راهکارهای گوناگونی، توسط افراد مختلف ارائه شدهاند. در این پایاننامه به بررسی آنها میپردازیم.
در اين فصل اصطلاحات، تعاریف، مفاهیم و سابقه مربوط به بي‌پاسخي و علل بروز آن، فعاليت‌هاي آماري مرتبط با بي‌پاسخي، راههاي جبران بي‌پاسخي و مقايسه نرخ‌هاي بي‌پاسخي را بررسی میکنیم.
برای جبران بیپاسخی و کاهش اریبی ناشی از بیپاسخی میتوان از دو رویکرد استفاده کرد، رویکرد اول مبتنی بر آمار کلاسیک است که سعی میکند بهنحوی اریبی بیپاسخی را کاهش دهد و محتاج مراجعات مکرر یا نمونهگیریهای مکرر است. رویکرد دوم روش بیزی است که در واقع تصحیح اریبی را بهوسیله شرطی کردن روی بیپاسخیها انجام میدهد.
اريكسون (1976) پيشگام مطالعه به روش بيزي در اين زمينه بوده است و بررسي وي در زمينه تشريح روش بيزي در ارتباط با گرفتن زير نمونه از واحدهاي بي‌پاسخ، بوده است. علاوه بر روش‌هاي بالا، اخيراٌ افراد ديگري از جمله ليتل (2003) رويكرد ديگري، اختيار كرده‌اند. به اين شرح كه افراد نمونه‌اي به دو زيرنمونة داراي پاسخ و بي‌پاسخ تقسيم مي‌شوند و سعي مي‌شود كه توزيع صفت مورد بررسي براي افراد با پاسخ به‌شرط مقادير متغير مورد بررسي براي افراد بي‌پاسخ طبق يك مدل آماري معيني به‌دست آورده شود.بدين ترتيب تصحيح لازم در مقادير مشاهده شده به‌عمل آيد به‌طوري‌كه اريبي ناشي از بي‌پاسخي از بين برود.
از آنجايي‌كه رويكرد ما در اين رساله مبتني بر اجراي طرح نمونهگيري و استفاده از نتايج آن و روش‌هاي فراوانيگرا است، از پرداختن به ارائهي مدل آماري براي تعديل برآوردگرهاي ناشي ازدادههاي بيپاسخ در تعيين برآورد احتمال حضور شخص در خانه و نیز روش‌هاي بيزي خودداري مي‌كنيم. خواننده علاقهمند میتواند به پاتهاف (1993) و لیتل (2003) مراجعه کند.
در بخش دوم اين فصل تعریف بیپاسخی و چند تعریف دیگر مرتبط با آن آورده ميشود. در بخش سوم اهميت و دلايل بروز بيپاسخي بررسي ميشود سپس در بخش چهارم اثرات بيپاسخي روي برآوردها و اريبي بيپاسخي روي ميانگين و محاسبه ميزان آن شرح داده ميشود. در بخش پنجم به تاريخچه تحقيق در زمينه بيپاسخي اشاره ميشود و در بخش ششم مثال كاربردي در طرح آمارگيري آمريكا، نحوه محاسبه نرخهاي بيپاسخي و دلایل اختلاف در معيارهاي بيپاسخي توضيح داده ميشود. همچنين در بخش هفتم روشهاي جبران بيپاسخي و كنترل نرخ بيپاسخي شرح داده ميشود و در انتها به نتيجهگيري اين فصل در بخش هشتم ميپردازيم.
1-2 بیپاسخی

در زير به تعاريف بيپاسخي، خطاهاي بيپاسخي، بيپاسخي سؤال، بيپاسخي واحد آماري و نرخ بيپاسخي ميپردازيم.
الف – علت‌هاي گوناگونی براي عدم توفيق در به‌دست آوردن پاسخ وجود دارد. برای مثال ممكن است واحد آماري در بررسي از قلم بيفتد، يا ممكن است شخص از مصاحبه امتناع ورزد، عدم دسترسي به واحد نمونهگیری و يا گم شدن پاسخنامه در طول مدت نمونه‌گيري (زمان آمارگيري) که باعث میشوند اطلاعات مورد نظر به‌دست نيايد ، باعث بروز “بيپاسخي” ميشود.
ب – خطاهاي بي‌پاسخي را كه يكي از خطاهاي غيرنمونه‌گيري است، وبروزآن ناشيازناتوانيواحدنمونه،اعضا جامعه يا داده‌ها در بررسي مي‌باشد تعریف میکنیم. اگر اطلاعات جمعآوری شده از يك مكان و يا شخص و يا از يك بخش خاص در پرسشنامه کامل نباشند، بررسي ما تحت تأثير خطاهاي بي‌پاسخي قرار مي‌گيرد.
دو نوع بیپاسخی ممکن است رخ دهد یکی بیپاسخی سؤال و دیگری بیپاسخی واحد آماری که در زیر آنها را تعریف میکنیم.
ج – به‌طوركلي ”بي‌پاسخي اقلام اطلاعاتي (سؤال) “ به مواردي اطلاق مي‌شود كه در زمان تكميل پرسشنامه، سؤال یا سؤالاتی بي‌پاسخ بمانند.
د – بعضي مواقع كه به واحدهاي آماري در نمونه مراجعه مي‌شود براي بعضی از واحدهاي آماري به‌دليل عدم حضور پاسخگو در منزل، امتناع پاسخگو يا دلايل ديگري، پرسشنامه تكميل نمي‌شود كه در اين‌صورت اصطلاحاً میگوییم ” بي‌پاسخي واحد آماری“ رخ داده است.
هـ – از محاسبه نسبت تعداد واحدهاي آماري واجد شرايط كه بيپاسخاند به تعداد كل واحدهاي آماري واجد شرايط، نرخ بيپاسخي به دست ميآيد.
بي‌پاسخي يكي از منابع بالقوه روابط و خطا در آمارگيري‌هاست كه در سال‌هاي اخير بسيار مورد توجه قرار گرفته است، به‌گونه‌اي كه نرخ بي‌پاسخي به‌علت پژوهش‌هاي گسترده در بررسي علل بي‌پاسخي در معرفي راهكارهاي مواجهه با آن روبه کاهش است. براي به حداقل رساندن مقدار خطاي بي‌پاسخي، مي‌توان از روش‌هاي مقابله با آن استفاده كرد،) مشكاني ومشكاني 1377 (.
1-3 اهميت بي‌پاسخي و علل بروز آن
بي‌پاسخي امري است كه هيچ محققی نمي‌تواند به‌طور كامل از آن پرهيز نمايد چرا كه جامعه مورد بررسي به‌طور كامل دراختيار او نيست و او تنها مي‌تواند به قسمتي از آن بهعنوان نمونه‌هاي تعیین شده دسترسي پيدا كند. در هر آمارگيري، تماس با بعضي افراد، خانوارها، بنگاه‌ها و ساير واحدهاي نمونه‌گيري، ميسر نمي‌شود. افراد به‌علت اشتغال و يا گذراندن تعطيلات در منزل نيستند، آدرس‌ها و شماره تلفن‌ها اشتباه هستند و يا عدم دسترسي مصاحبه كننده به خانوارهاي ساكن در مناطق دورافتاده، از جمله موارد عدم امكان برقراري تماس، محسوب مي‌شوند. حتي در صورت برقراري تماس نيز ممكن است بعضي از واحدها به بعضي از سؤالات آمارگيري پاسخ ندهند،)بزرگ نيا وحسينيون1366 ،بزرگ نيا و صادقي 1368 (.
در آمارگيري در سه مرحله ممكن است موضوع بي‌پاسخي مربوط به واحد آماري يا بي‌پاسخي مربوط به اقلام اطلاعاتي اتفاق بيفتد که عبارتند از
تعیین محل واحد آماری یا تماس با واحد آمارگیری
پاسخگیری از واحد آماری
جمعآوری اطلاعات
مرحله تماس با واحد آمارگيري (تعيين محل واحد آماري) به مرحله‌اي اطلاق مي‌شود كه طي آن مأمور آمارگيري تلاش مي‌كند با واحدهاي نمونه تماس برقرار كند تا اطلاعات لازم را كسب كند. در صورتي‌كه مأمور آمارگيري نتواند با واحد آماري نمونه تماس بگيرد، موضوع بي‌پاسخي مربوط به واحد آماري رخ داده است.
صحيح و كامل بودن آدرس هريك از واحدهاي نمونه، عوامل موفقيت در اين مرحله هستند. دسترسي به واحدهاي نمونه از ديگر عوامل موثر در اين زمينه است.
آمارگيري و مصاحبه با افراد ساكن در مناطق تحت كنترل از ديگر مشكلات مربوط به مرحله تماس با واحد آماري مي‌باشد. بايد به زمان مراجعه و تعداد دفعات مراجعه به واحد آماري براي دريافت اطلاعات مورد نظر جهت تأثيرگذاري در بروز بي‌پاسخي در مرحله تماس با واحد آماري نیز توجه کرد.
پس از تماس با واحد آماري نمونه، در بعضي موارد ممكن است واحد نمونه از دادن پاسخ امتناع كند و پرسشگر موفق به كسب اطلاعات لازم نشود. در اين صورت براي اين‌گونه واحدهاي نمونه نيز موضوع ”بي پاسخي واحد آماري“ رخ داده است.
در آمارگيري‌هايي كه از طريق مصاحبه انجام مي‌شود ميزان موفقيت در جلب همكاري مردم، حس كنجكاوي و داشتن بينش كافي درباره اهداف آمارگيري از ديگر عوامل مثبت براي موفقيت در كسب پاسخ، تلقي مي‌شود.
در ميان عواملي كه موجب كاهش همكاري در ارايه اطلاعات مي شود مي‌توان به ترس و بيم، عدم اطمينان به محرمانه بودن پاسخ‌ها، داشتن خصومت با مجریان آمارگيري، خستگي، نظارت و آموزش ناكافي، حساسيت داشتن نسبت به هدف از آمارگيري از جمله عوامل منفي به‌حساب مي‌آيند.
جمعآوري از اطلاعات نيز به مرحلهاي از آمارگيري اطلاق ميشود كه پرسشنامه آمارگيري تكميل و پس از ويرايش آماده تجزيه و تحليل ميشود و خطاهايي كه به هنگام آمادهسازي دادهها براي تجزيه و تحليل، بهوجود ميآيد باعث ميشود كه بعضي از اقلام اطلاعاتي پرسشنامه، بدون پاسخ بماند مثلاً مصاحبهكننده بهطور تصادفي پاسخ برخي از سؤالها را مشخص نكند.
حال در ادامه دلایل عمده و مهمی که ممکن است باعث بیپاسخی شوند را میآوریم.
– موضوع آمارگيري: در صورتي كه موضوعهای مطرح شده در آمارگيري مورد علاقه پاسخگو باشند، مي‌توان افزايش نرخ پاسخگويي و در نتيجه كاهش نرخ بي‌پاسخي را انتظار داشت. در حالت كلي به سؤالات داراي ويژگي‌هاي عمومی، بيشتر از سؤالات شخصی پاسخ داده مي‌شود.
– نوع مصاحبه: نوع مصاحبه نيز از جمله مواردی است كه روی ميزان بي پاسخي تأثير دارد. مصاحبه‌هاي حضوري با استفاده از مأموران آمارگير آموزش‌ديده معمولاً نسبت به آمارگيري‌هاي پستي، تلفني و يا اينترنتي از نرخ پاسخگويي بيشتري برخوردار هستند. زیرا در مصاحبههای حضوری آمارگیر میتواند پاسخگو را به نحوی راضی به دادن پاسخ نماید. اما در آمارگیریهای پستی، تلفنی و یا اینترنتی از آنجا که پاسخگو با کسی روبرو نیست اغلب پاسخگویی را به تأخیر انداخته، گاهی آن را فراموش میکند، یا اصلاً به آن اهمیت نمیدهد.
– فرد پاسخگو: در برخي از آمارگيري‌‌هاي خانوار، اگر فرد پاسخگو سرپرست خانوار تلقي شود، نرخ بي‌پاسخي قلم آماري كمتر ميشود، و اگر به‌طور تصادفي يك فرد پاسخگو برگزيده شود، ممكن است نرخ بي‌پاسخي قلم آماري به‌علت اطلاعات كم فرد انتخاب شده، كاهش نيابد.
نرخ‌هاي بي‌پاسخي برحسب اينكه پاسخگو هر سني داشته باشد و يا اينكه تعداد تماس‌ها چندبار باشد، متفاوت است. بنابراين برای کاهش نرخ بیپاسخی در طرح‌هاي نمونه‌گيري میتوان سیاستهای زیر را بهکار برد.
– سعي شود از ديدگاه‌های مختلف تا حد ممكن نرخ بي‌پاسخي كاهش يابد.
– از آنجايي كه هيچگاه نرخ بي‌پاسخي عليرغم تمام تلاش‌ها به صفر نخواهد رسيد، بايد با به‌كارگيري روش‌هاي علمي مناسب با داده‌هاي بي‌پاسخ نسبت به جايگزيني يا جانهي آنها اقدام نمود.
1-4 اريبي ناشي از بيپاسخي
هنگامی که مشاهدات را جمعآوری کردیم، با استفاده از آنها به استنباط در مورد پارامترهای جامعه میپردازیم. همانطورکه میدانیم یکی از شاخههای استنباط آماری، برآوردیابی پارامترها است. حال اگر مشاهدات جمعآوری شده حاوی بیپاسخی باشند، این بیپاسخیها قطعاً روی برآوردهای ما تأثیر میگذارند و اریبیهایی را بهوجود میآورند. در این بخش، اریبی حاصل از بیپاسخیها روی برآورد میانگین جامعه را بررسی میکنیم و مقدار این اریبی را محاسبه خواهیم کرد.
موضوع اريبي ناشي از بي‌پاسخي از مفاهيم اساسي در بي‌پاسخي است. این اریبی، به‌دليل عدم توانايي برای به‌دست آوردن اطلاعات بعضی از واحدهاي نمونه برای برآورد پارامترها به ‌وجود مي‌آيد كه آن را اريبي بي‌پاسخي میگويند. اریبی فوق، يك اندازه مهم براي تعيين اثر بي‌پاسخي روي خطای آمارگيري بوده و تعیین مقدار آن لازم است،(يارمحمدي1383).
براي محاسبه اريبي بي‌پاسخي فرض مي‌كنيم جامعه‌اي با عضو داریم كه به دو طبقه تقسیم میشود. طبقه اول را طبقه بدون پاسخ گفته و داراي عضو و ميانگين است و طبقه دوم را طبقه پاسخ دهنده مینامیم و داراي عضو و ميانگين است. را نسبت اعضاي پاسخ‌دهنده به كل جامعه و را نسبت اعضاي بدون پاسخ به كل جامعه درنظر میگیریم. یعنی و و واضح است كه . بنابراین ميانگين جامعه به‌صورت زير است:

حال فرض کنید تعداد مشاهده از این جامعه بهدست آوردهایم بهطوریکه در این نمونه فرد پاسخگو و فرد بیپاسخ داریم. میانگین نمونهای افراد پاسخگو را با نشان میدهیم که برآورد اريبي از جامعه خواهد بود زيرا مبتنی بر مقادیر نمونهای افراد پاسخگوست. برای محاسبه میزان اریبی برآوردگر ، دو نتیجه زیر را میآوریم.
نتيجه 1-1. مقدار اريبي و بهترتيب عبارتند از
اريبي
اريبي
اثبات.
براي اثبات قسمت داريم
اریبی

و براي اثبات قسمت با توجه به اينكه است، داريم
اریبی

و اثبات تمام است.
تعریف 1-2. اريبي نسبي را بهصورت زير تعریف میکنیم
اریبی نسبی
نتیجه 1-3. میانگین توان دوم خطای برابر است با

1-5 سابقهی پژوهش
بيپاسخي، عمليات آمارگيري را دچار نقص ميكند و هنگام تهيه طرح و تجزيه و تحليل دادهها، مشكلات اساسي را بهوجود ميآورد و مقالاتي كه هركدام روشي را براي جلوگيري از بروزبيپاسخي، اندازهگيري يا جبران آن ارايه كردهاند، به رشته تحرير درآمده است. طي دهه 90 ميلادي تأثير خطاي بي‌پاسخي و اريبي ناشي از آن در برآوردهاي يك آمارگيري نمونه‌اي به‌عنوان موضوع مهمي در تحقيقات و پژوهش‌هاي آماري توسط آتروستيك، بيتس، برت و سيلبرستن در سال 2001 ، مورد بررسي قرار گرفته است. طي سال‌هاي 1997 تا 2001 ميلادي يك گروه درون‌سازماني مطالعات بي‌پاسخي در طرح‌هاي آمارگيري خانوار (طولی، پانلی، …) ایالات متحده آمريكا كه با هماهنگي دفتر سرشماري و دفتر آمارهاي نيروي كار ايالات متحده در مورد مسائل مربوط به آمارگيري خانوار، مطالعاتي انجام داده‌اند.
هانسن و هورويتز در سال 1946، براي به‌دست آوردن برآوردهاي نااريب در بررسي‌هاي پستي، در زمان وقوع بي‌پاسخي راه‌حلي را پيشنهاد كرده‌اند كه در فصل دوم این پايان نامه توضيح داده شده است.
هم‌چنين پوليتز و سيمونز در سال‌هاي 1950-1949، دمينگ در سال 1953، لسلر و كالسبيك در سال 1992، لوي ولمه شو در سال 1991 نيز در مورد اصول كلي بي‌پاسخي و حل مشكلات آن مطالبي ارايه نموده‌اند.
پاتهاف و همکاران وی (1993) برای تعدیل اریبی ناشی از بیپاسخی مدلی را ارایه کردند که احتمال در خانه بودن پاسخگو را توصیف میکند. آنها این مدل را در مدل دو پارامتری (توزیع بتا)، و دو نوع مدل سه پارامتری بررسی کردند و از روی دادهها احتمال حضور در خانه را برآورد نمودند. سپس با استفاده از این احتمال به تعدیل برآوردگرهایی که از روی دادههای شامل بیپاسخی بودند، پرداختند. در واقع با وزن دادن به نتایج حاصل از مراجعات مکرر به برآوردهای بهتری دست یافتند.
كالتون (1986)، لپكووسكي(1989)، ريزو، كالتون وبريك (1996) راه‌هايي را براي درمان بي‌پاسخي در دفعات نمونه‌گيري در بررسي‌هاي گروهي، و همچنين وتك (2000) و هاكس (2000) مدل‌بندي ترك اعضاي گروه را با مدل‌هاي معادلة ساختاري و با مدل‌هاي چند سطحي بحث كرده‌اند.
روبين (1976) به تفاوتهاي منظم بين واحدهايي كه به سوال خاصي پاسخ دادهاند و آنهايي كه پاسخ ندادهاند، دست يافت. ليتل و روبين (2002) موضوع تصادفي بودن يا تصادفي نبودندادههاي گم شده را تحقيق كردند و به راهبردهايي در تحليل بعدي دادهها دست يافتند. هم چنين لسلروكالسبيك (1992) و هويسمن (1999) با بررسيها نشان دادند كه تحليلها ممكن است روي مجموعه يا زيرمجموعههاي مختلف از دادهها انجام شوند كه ميتوانند با يكديگر ناسازگار باشند وهمچنينلسلروكالسبيكبهگمشدگيپرسشنامهيكواحدكههمكاريصورتگرفتهوليدرخلالويرايشدادهها،گمشدهاندتعاريفيارائهنمودهاند.ليتلوروبين(2002)وآربوكلوورمورنت(1996) راهبردهاي نويني براي مقابله با دادههاي گم شده ارائه دادهاند كه به ترتيب عبارت است از روش جانهي و روش برآورد مستقيم. در روش جانهي به جاي مقادير گم شده، برآوردهاي معقول قرار داده ميشوند تا مجموعه دادهها كامل شود و در روش برآورد مستقيم همه دادههاي موجود با استفاده از يك رويكرد ماكسيمم درستنمايي تحليل ميشوند.
گرووز و كوپر (1998) روشهاي لازم براي كارشناسان ميداني و نمونهگيري جهت ارائه اطلاعات مفيد به آمارشناسان نمونهگيري و جانهي (تعديل كنندگان بيپاسخي) دادهاند تا آنهاتعديلهاي خود را براساس آن اطلاعات پايهگذاري كنند به شرط اينكه اين افراد احتياطهاي لازم براي بيپاسخي را درنظر گرفته و براي آن برنامهريزي كرده باشند.
ديلمن، التينگ، گرووز و ليتل (2002) مرور كلي بر بيپاسخي واحد را ارائه دادهاند.رات (1994) ابزارهايي را براي كاهش قابل توجه وقوع دادههاي گم شده با آگاهي از ساختار و الگوهاي دادههاي گم شده، براي انتخاب شيوه درمان صحيح، توليد كرده است كه اين امكان را بوجود آورده است كه از طريق به حساب آوردن ساختار و الگوهاي دادههاي گم شده به روش درست، تحليل كند. همچنین دلو، هاکس و هویسمن (2003) اقدامات لازم برای پیشگیری از بیپاسخی را انجام داده و روشهای درمان بیپاسخی را مورد بررسی قرار دادند.
هم چنين هويسمن)1999) و زوون (1999) براي دادههاي گم شده اي كه براي برخي سوالها در مورد همه پاسخگويان مصداق ندارند، بررسي هايي نموده اند.جنسن (1997) از آزمون ناكامل در آزمونهاي آموزشي استفاده نموده است.
هم چنين گراهام و دونالدسون (1993) بررسي كردند كه اگر مکانیزم گم شدگي دست يافتني باشد، نتايج بدست آمده نااريب خواهند بود.
بيتي و هرمن (2002) نيز در مورد تمايل پاسخگو به پاسخ كه نتواند پاسخ دهد و منجر به بروز دادههاي گم شده تصادفي ميشود نيز راهحلهايي براي درمان ارائه دادهاند.
تورانگو (1984) ، استراك و مارتين (1987) و شوارز (1997) مراحل فرآيند پرسش و پاسخ براي تمايز بين عوامل تعيين كننده گوناگون بيپاسخي سوال بررسيها و كنترلهايي انجامدادهاند.
يك تحليل گسترده توسط دلو (1992) نشان داد كه آمارگيريهاي مصاحبهاي (هم چهره به چهره و هم تلفني) معمولاً منجر به بيپاسخي سؤال كمتري از آمارگيريهاي پستي ميشوند.
بي‌پاسخي، عمليات آمارگيري را دچار نقص مي‌كند و هنگام تهيه طرح و تجزيه و تحليل داده‌ها، مشكلات اساسي را به‌وجود مي‌آورد و مقالاتي كه هركدام روشي را براي جلوگيري از بروز بي‌پاسخي، اندازه‌گيري يا جبران آن ارايه كرده‌اند، به رشته تحرير درآمده است.
1-6 يك مثال كاربردي
در اين بخش به کمک یک مثال نرخ‌هاي بي‌پاسخي در بين طرح‌هاي آمارگيري مستمر از خانوارها در ايالات متحده آمريكا، مقايسه شده‌اند كه اين مقايسه‌ها مربوط به سال‌هاي 1990 تا 1999 مي باشد. بررسي معيارهاي اساسي بي‌پاسخي ديدگاه‌هاي تازه‌اي را در مورد روند بي‌پاسخي‌هاي اخير، آشكار مي‌سازد. در ساختار طرح از آمارگيريهاي پانلي و طولي نيز استفاده شده است که در زیر آنها را تعریف میکنیم.
تعریف 1-4. آمارگيري‌هايي كه مصاحبه‌هاي تكراري در مورد يك واحد انجام مي‌شود و در آن جابجایی افراد اهمیت ندارد بلكه مكان مورد مراجعه در مصاحبه اول حائز اهميت است که در مراجعات بعدي، آن مكان مدنظر است را آمارگیریهای پانلی گویند.
تعریف 1-5. آمارگيري‌هایی که واحدها و افراد در آدرس‌هاي مختلف پيگيري مي‌شوند را آمارگیریهای طولی مینامند. در اين جدول ساختار طرح برحسب طولي، تعداد مصاحبه، پانلي و يادداشت روزانه، زمان آمارگيري، روش مصاحبه، روش آمارگيري و فراواني هر مصاحبه در هريك از طرحهاي مذكور، درج شده است.
بهدلیل اهمیت نرخ‌هاي بي‌پاسخي طرح‌هاي آمارگيري، سازمان‌هاي مجري طرح‌هاي آمارگيري از نرخ‌هاي بي‌پاسخي به‌عنوان ابزاري براي بهبود طراحي و جمع‌آوري اطلاعات طرح‌هاي آمارگيري استفاده مي‌كنند. بنابراين مقايسه نرخ‌هاي بي‌پاسخي در طرح‌هاي مختلف، باعث آشكار شدن علل بي‌پاسخي در طرح‌ها مي‌شوند. در اين مثال، مجموعه‌اي از معيارهاي اساسي بي‌پاسخي براي شش طرح آمارگيري خانوار در ايالات متحده، مطرح شده است. اين طرح‌ها عبارتند از: طرح آمارگيري جاري جمعيت (CPS) ، طرح آمارگيري از هزينه‌هاي مصرفي خانوار (CE) كه به دو صورت يادداشت روزانه (CED) و فصلي (QCES) انجام مي‌شود، طرح آمارگيري بهداشت ملي (NHIS) ، طرح آمارگيري جرائم در سطح ملي (NCVS) و طرح آمارگيري از درآمد و مشاركت خانوار (SIPP) . به‌علت وسعت و تداوم طرح‌هاي فوق، دفتر سرشماري آمريكا جمع‌آوري داده‌ها را به‌عهده دارد. در اين طرح‌ها، اولين مصاحبه به‌صورت مصاحبه حضوري، بعد از فرستادن يك معرفي‌نامه به محل واحد آماري، انجام مي‌گيرد.
تفاوت در ويژگي‌هاي اساسي طرح‌هاي فوق، در نرخ‌هاي بي‌پاسخي آنها نيز تأثير دارد. موضوع طرح، طول زماني مصاحبه، تعداد كل مصاحبهها، مدت زمان آمارگيري، روش مصاحبه بعد از اولين مصاحبه حضوري از جمله ويژگي‌هاي اساسي‌اند. نحوه طراحي آمارگيري و جمع‌آوري اطلاعات طرح‌هاي مذكور در جدول 1-1، فهرست شده است.
از آنجايي‌كه اولين مصاحبه براساس مصاحبه حضوري انجام مي‌شود، اولين نرخ‌هاي بي‌پاسخي، تحت‌تأثير تفاوت‌هاي موجود بين‌طرح‌ها در نوع روش‌هاي مصاحبه به‌كار گرفته شده در تماس‌هاي بعدي با خانوار، قرار نمي‌گيرند. دلايل بي‌پاسخي خانوارها، به چهار طبقه تقسيم شدند که از مؤلفههای بیپاسخیاند: 1) امتناع از پاسخ،2) عدم حضور شخص در خانه، 3) غيبت موقت خانوار و4) ساير موارد.
جدول 1-2، نحوه محاسبه نرخ بي‌پاسخي در مصاحبه اوليه را براي سال‌هاي 1999-1990 و نمودارهاي 1-1 و 1-2 و 1-3 نرخ‌هاي بي‌پاسخي اوليه را براي سال‌هاي 1999-1990 نشان مي‌دهد.
همچنین نرخ‌هاي بي‌پاسخي اوليه 6 طرح آمارگيري كه در نمودار 1-1، ارايه شده‌اند. از اوايل دهه 1990 تا حدودي در حال افزايش هستند. در نمودار 1-2، نرخ‌هاي امتناع از پاسخ‌دهي اوليه براي سال‌هاي1990 الي 1999 نشان داده شده است و نرخ‌هاي امتناع از پاسخ اوليه، در هريك از 6 طرح مذكور در زمان مورد مطالعه (سال هاي 1990 تا 1999) افزايش يافته است. همچنين در جدول 1-3، نرخ‌هاي بي‌پاسخي اوليه در اوايل و اواخر دهه 1990 نشان داده شده‌اند.
همانطوركه انتظار مي رود بالاترين نرخ‌هاي بي‌پاسخي در سال‌هاي اخير است، در جداول فوق، طرح SIPP در سال 1999 اجرا نشده و بنابراين از اولين مصاحبه پانلي 2000 اين طرح، استفاده شده است. براي طرح NCVS ، نرخ عدم حضور در خانه از سال 1992 موجود مي‌باشد. براي طرح‌هاي CPS و NCVS ، نرخ عدم حضور در خانه از سال 1994 موجود مي‌باشد.
جدول 1-3 نرخ‌هاي امتناع از پاسخ اوليه، در اوايل و انتهاي دوره ده‌ساله و امتناع از پاسخ را به‌عنوان درصدي از كل بي‌پاسخي در مصاحبه اوليه نشان مي‌دهد. تا سال 1999 امتناع از پاسخ به‌عنوان نسبتي از كل بي‌پاسخي اوليه، براي طرح NCVS و تا حدودي براي طرح‌هاي CED و SIPP افزايش يافته است. امتناع از پاسخ‌ها تقريباً سه‌چهارم از بي‌پاسخي نخستين را براي طرح‌هاي CED و SIPP و بيشتر از 50 درصد را براي طرح CED در ابتدا و در انتهاي دهه مورد مطالعه شامل مي‌شوند.
در مورد طرح NHIS ، به‌نظر مي‌رسد كه كاهش نسبتاً زيادي در نرخ امتناع از پاسخ به‌عنوان درصدي از كل بي‌پاسخي نخستين (18- درصد) وجود دارد. كه در واقع نتيجه افزايش نسبتاً زياد واحدهاي مصاحبه شده به‌صورت ناقص، در سال 1999 مي‌باشد.
با توجه به نمودار 1-2 و جدول 1-3، مشاهده مي شود كه نرخ عدم حضور در خانه به مدت زمان آمارگيري بستگي دارد، هرچه اين فاصله زماني كوتاهتر باشد، احتمال پيدا نكردن شخص در خانه، افزايش مي‌يابد.با توجه به نمودار 1-3، در نيمه دوم دهه 1990. نرخ عدم حضور در خانه در 6 طرح آمارگيري افزايش يافته است.
حال به بررسی عوامل اساسی وجود اختلاف بین معیارهای بیپاسخی طرحهای آمارگیری فوق اشاره میکنیم که به صورت زیر هستند.
– عدم تماس با واحدهاي آماري
واحدهاي آماري كه تا پايان آمارگيري، تماس با آنها امكان‌پذير نمي‌باشد، بر نرخ‌هاي بي‌پاسخي تأثير مي‌گذارند. مثلاً عمليات ميداني طرح CEQ يك ماه به‌طول مي‌انجامد و بي‌پاسخي مربوط به عدم تماس، سهم كمتري در افزايش نرخ بي‌پاسخي دارد.
– روش‌هاي آمارگيري
به‌دليل طولاني بودن دوره‌هاي زماني آمارگيري‌هاي پانلي، ممكن است در شرايط عمليات ميداني تغييراتي صورت گيرد. مثلاً نحوه برخورد شخصي كه پاسخ میدهد و شخصي كه امتناع از پاسخ دارد از يك مصاحبه تا مصاحبه بعدي، فرق كند و يا پرسشگر، در مصاحبه‌ها، تغيير كند و شرايط ديگري كه مي‌تواند روي نرخ‌هاي پاسخ، اثرگذار باشد.
موضوع SIPP
درآمد، نيروي كار، مشاركت اجتماعي NHIS
وضعيت سلامت NCVS
ارتكاب جرم CPS
اشتغال، بيكاري خصوصيات نيروي كار CEQ
درآمد و هزينه مصرف‌كننده CED
درآمد و هزينه مصرف‌كننده
ساختار طرح طولي يكبار مصاحبه پانلي پانلي پانلي يادداشت روزانه
واحد مورد مطالعه فرد خانوار ساكن در نمونه خانوار ساكن در نمونه خانوار ساكن در نمونه مصرف‌كننده(ها)ي ساكن در واحد نمونه مصرف‌كننده(ها)ي ساكن در واحد نمونه
تعداد مصاحبه‌ها 12 1 7 8 5 3
زمان آمارگيري متغير بين 30 تا 48 ماه يك روز، تا تكميل شدن پرسشنامه 37 ماه 16 ماه 13 ماه 2 هفته متوالي
حداكثر زمان براي تماس مجدد 4 ماه متفاوت: 2 هفته، 3 تا 12 ماه 6 ماه متفاوت: 1 هفته، 1 ماه 1 ماه بعد از مصاحبه اوليه، 3 ماه براي مصاحبه‌هاي بعدي 1 هفته بعد از جمع‌آوري پرسشنامه‌ها (در صورتي كه يادداشت‌ها تكميل نشده باشند)
روش مصاحبه در مصاحبه اوليه مصاحبه حضوري مصاحبه حضوري مصاحبه حضوري مصاحبه حضوري مصاحبه حضوري مصاحبه حضوري
روش مصاحبه در مصاحبه‌هاي بعدي مصاحبه حضوري يا تلفني ندارد مصاحبه حضوري يا تلفني مصاحبه حضوري يا تلفني مصاحبه حضوري مصاحبه حضوري
روش آمارگيري مصاحبه حضوري يا تلفني با كمك كامپيوتر مصاحبه حضوري يا تلفني با كمك كامپيوتر مصاحبه حضوري يا تلفني با كمك كامپيوتر و بدون كامپيوتر مصاحبه حضوري يا تلفني با كمك كامپيوتر مصاحبه حضوري بدون استفاده از كامپيوتر مصاحبه حضوري بدون استفاده از كامپيوتر / يادداشت روزانه
زمان آمارگيري 1 ماه 2 هفته 2 هفته 10 روز 1 ماه 1 هفته
فراواني هر مصاحبه هر 4 ماه يكبار در سال هر 6 ماه ماهانه براي 4 ماه و بعد از 8 ماه عدم مراجعه، دوباره ماهانه براي 4 ماه هر 3 ماه هفتگي
-342900266700جدول 1-1 . خصوصيات و روش‌هاي جمع‌آوري اطلاعات شش طرح آمارگيري مورد مطالعه
00جدول 1-1 . خصوصيات و روش‌هاي جمع‌آوري اطلاعات شش طرح آمارگيري مورد مطالعه

نرخ نحوه محاسبه
نرخ پاسخ مصاحبه اوليه تعداد واحدهاي مصاحبه شده تقسيم بر تعداد واحدهاي واجد شرايط مصاحبه
نرخ بي‌پاسخي مصاحبه اوليه تعداد واحدهاي آماري واجد شرايط مصاحبه كه به‌علت مشكلاتي از قبيل زبان، امتناع از پاسخ‌، عدم دسترسي به اعضاي خانوار در خانه، غيبت موقت خانوار و ساير موارد پاسخگو نبوده‌اند، تقسيم بر تعداد كل واحدهاي آماري واجد شرايط مصاحبه
نرخ بي‌پاسخي به‌علت امتناع از پاسخ در مصاحبه اوليه تعداد واحدهاي آماري واجد شرايط مصاحبه كه از شركت در مصاحبه امتناع نموده تقسيم بر تعداد كل واحدهاي آماري واجد شرايط مصاحبه
نرخ بي‌پاسخي به‌علت در خانه نبودن خانوار در مصاحبه اوليه تعداد واحدهاي آماري واجد شرايط مصاحبه كه به‌علت نبودن در خانه در مدت زمان آمارگيري، امكان انجام مصاحبه با آنها ميسر نگشته، تقسيم بر تعداد كل واحدهاي آماري واجد شرايط مصاحبه
نرخ بي‌پاسخي خانوارهاي موقتاً غايب در مصاحبه اوليه تعداد واحدهاي واجد شرايط مصاحبه كه به‌علت دور بودن موقت خانوار از محل سكونت، با آنها مصاحبه انجام نپذيرفته تقسيم بر تعداد كل واحدهاي آماري واجد شرايط مصاحبه
نرخ بي‌پاسخي ساير علل (غير از علت‌هاي ذكر شده در موارد قبل) تعداد واحدهاي آماري واجد شرايط مصاحبه كه به‌دلايلي غير از دلايل بالا با آنها مصاحبه انجام نپذيرفته، يا در حين انجام اديت موضوعي، به‌عنوان واحدهاي بدون پاسخ تلقي گرديده‌اند، تقسيم بر تعداد كل واحدهاي آماري واجد شرايط مصاحبه
جدول 1-2. نحوه محاسبه نرخ‌هاي بي‌پاسخي و پاسخ در مصاحبه اوليه
SIPP
% NHIS
% NCVS
% CPS
% CEQ
% CED
%
نرخ هاي بي پاسخي اوليه
1990
1999 3/7
2/11 5/4
4/12 3/4
5/7 7/5
2/9 12
1/18 3/16
28
نرخ‌هاي امتناع از پاسخ اوليه
1990
1999 3/5
4/8 7/2
2/5 8/1
5/3 2/2
3/3 5/9
1/13 4/8
15
نرخ هاي عدم حضور خانوار در خانه
1990
1999 1
4/1 8/0
4/2 7/1
8/2 7/2
6/3 2/1
3/3 7/1
5/4
امتناع از پاسخ به عنوان درصدي
از بي پاسخي
1990
1999
تفاوت 73
75
2 60
42
18- 42
47
5 39
36
3- 79
72
7- 52
54
2
عدم حضور در خانه به‌عنوان درصدي
از بي پاسخي
1990
1999
تفاوت 14
13
1- 18
19
1 40
37
3- 47
39
8- 10
18
8 10
16
6
جدول 1-3 . نرخ‌هاي ”بي‌پاسخي اوليه“، نرخ‌هاي ”امتناع از پاسخ اوليه“ و نرخ‌هاي ”عدم حضور در خانه“ در سال‌هاي 1990 تا 1999

-114300-736600
00

0246380
00

42545139700
00

روش تماس با پاسخگو
بعضي از پاسخگويان به‌علت ترس از وقوع حوادث در جلوي درب منزل، يا از ورود افراد پرسشگر به منزل، معمولاً روش مصاحبه تلفني را بر مصاحبه حضوري ترجيح مي‌دهند. در حالي‌كه مصاحبه تلفني نرخ بي‌پاسخي بيشتري نسبت به مصاحبه حضوري دارد. مثلاً در NCVS در اغلب مصاحبه‌ها پس از اولين مصاحبه، از روش مصاحبه تلفني استفاده مي شود و طرح CPS ، متغير است.
1-7 روش‌هاي جبران بي‌پاسخي
محدود كردن اريبي بي‌پاسخي، مستلزم كنترل نرخ بي‌پاسخي است كه مي‌توان روش جمع‌آوري اطلاعات را به‌گونه‌‌اي طراحي كرد كه وقتي فردي به نمونه انتخاب مي‌شود، احتمال اينكه فرد جزو گروه بي‌پاسخي‌ها باشد، كاهش بيابد.
به‌طوركلي در روش‌هاي پيشگيري جهت جبران بي‌پاسخي، هدف افزايش نرخ پاسخ در جامعه است يعني كه نرخ مورد انتظار براي پاسخ است، كه N تعداد كل واحدهاي جامعه است. بر اين اساس تصميم‌گيري در مورد مقدار قابل قبول براي ، حائز اهميت است.
موضوع طرح، جامعه مورد مطالعه، نحوه جمع‌آوري اطلاعات و استفاده از روش‌هاي مختلف براي جبران بي‌پاسخي در ميزان نرخ بي‌پاسخي دلالت دارد. از روش‌هاي جبران‌ بي‌پاسخي مي‌توان به روش‌هاي زير اشاره كرد:
– مراجعات مكرر جهت دريافت پاسخ
فراهم كردن امكان مراجعات مكرر با برنامه زمان‌بندي مناسب به واحدهاي نمونه شانس دريافت پاسخ را افزايش مي‌دهد، در زماني‌كه در مراجعه اول پاسخي دريافت نشده باشد.
ممكن است افرادي كه در مراجعات قبلي، تمايل به همكاري نداشتند، در مراجعات بعدي، تمايل به پاسخگويي داشته باشند. از طرفي افزايش دفعات مراجعه از يكسو موجب كاهش اريبي بي‌پاسخي مي‌شود و از سوي ديگر در افزايش هزينه‌ها، تأثير دارد كه بايد تعداد مراجعات به‌گونه‌اي تعيين شود كه افزايش هزينه‌ها، كنترل و دراختيار طرح باشد. دمينگ (1953) روش‌هاي مختلفي را براي تعيين تعداد بهينه دفعات مراجعه، ارايه و بررسي كرده است که در فصل چهارم ذکر شده است.
– دقيق بودن مشخصات جغرافيايي واحدهاي نمونه
مشخصات جغرافيايي شامل آدرس دقيق، شماره تلفن منزل، محل كار، نام و آدرس محل كار از جمله اقلامي‌اند كه مي‌تواند براي كمك پرسشگر جهت تعيين و مراجعه به واحدهاي نمونه، مؤثر باشند. بنابراين ابزاري چون نقشه جغرافيايي واحد نمونه بهنگام، مي‌تواند كمك مؤثري باشد. بنابراين اگر مشخصات مندرج در فهرست نام و نشان واحد نمونه، دقيق نباشد، احتمال عدم دستيابي به واحدهاينمونه،افزايشمي‌يابدكهدراينصورت مدارك دراختيار پرسشگر، بايد شامل اطلاعات كافي باشد.
– يادآوري‌هاي مجدد
در روش آمارگيري‌هاي پستي، ارسال كارت پستال يا تلفن زدن، تلگراف، نامه به واحد آماري موردنظرجهتترغيبوتشويقافرادپاسخگودرتكميلپرسشنامه‌ها، در كاهش ميزان بي‌پاسخي، مؤثر است.
– انگيزه
براي جلب همكاري افراد مي‌توان با دادن هديه، پاداش نقدي و تضمين ارسال يك نسخه از نتايج آمارگيري انگيزه آنان را در پاسخ‌دهي، افزايش داد. ايجاد انگيزه به طرق مختلف، باعث كاهش نرخ بي‌پاسخي مي‌شود.
– تأييدنامه از افراد معتبر
در آمارگيري‌هايي كه با كارگاه‌ها سر و كار دارد، داشتن تأييدنامه از طرف سازمان‌هاي مربوطه، در ميزان افزايش پاسخ‌دهي مؤثر است چرا كه باعث كاهش ترديد افراد در پاسخ‌دهي مي‌شود.
– ارسال نامه قبل از شروع آمارگيري
با توجه به موضوع آمارگيري، قبل از تماس اصلي با واحدهاي نمونه، با ارسال نامه از سوي سازمان مجري طرح از انجام مصاحبه افراد پاسخگو را مطلع مي‌كنند. اين روش، اعتبار پرسشگرها را در زمان تماس اصلي افزايش مي‌دهد و باعث افزايش احتمال پاسخگويي مي‌شود.
– گرفتن زيرنمونه از واحدهاي بي‌پاسخ
ايده اصلي گرفتن زيرنمونه از واحدهاي بي‌پاسخ كه توسط هانسن و هورويتز (1946) پيشنهادشدهاست،ازشيوهكلاسيكبراياستنباط آماري استفاده مي‌كند. در اكثر تئوري‌هاي موجود فرض مي‌شود كه كليه واحدهاي بدون پاسخ كه به‌عنوان زيرنمونه انتخاب شده‌اند، بالاخره پاسخ خواهند داد.
انتخاب زيرنمونه از واحدهاي بدون پاسخ، اغلب در آمارگيري‌هاي پستي به‌كار مي‌رود و تلاش از طريق تماس تلفني يا مراجعه مي‌تواند منجر به اخذ درصد بالايي از اطلاعات مفيد در مورد زيرنمونه انتخابي از واحدهاي بدون پاسخ بشود.
1-8 خلاصه و نتيجه‌گيري
همانطورکهازمطالباینفصلبرمیآیدبیپاسخیمشکلیعمدهدرطرحهاینمونهگیریاست. انواع مشکلاتیکهازبیپاسخیناشیمیشوندازقبیلاریبیدربرآورد،افزایشواریانسبرآوردها،موردبحثقرارگرفتند.
علل بروز این مشکل در این فصل بررسی شدند و روشهایی برای جبران آنها در قالب یک مثال كه با مقايسه نرخهاي بيپاسخي انجام شد، بیان شدند.
بنابراین، برای مقابله با مشکل بیپاسخی باید در درجه اول راههای پیشگیری از آن دقیقتر بررسی شوند و در مرحلهی بعد در صورتیکه با بیپاسخی در دادههای نمونهگیری روبرو هستیم راههای درمان آن با تفصیل بیشتر مورد بحث قرار گیرند. این مطالب را در فصل دوم كه با استفاده از روش آمارگيري پستي و مصاحبه حضوري (روش هانسن و هورويتز)، در فصل سوم با استفاده از روش پوليتز – سيمونز، در فصل چهارم با استفاده از روش دمينگ به بررسی کاهش خطای بیپاسخی میپردازیم. البته این روشها را بهدلیل متمایز بودن روش اجرای آمارگیری نمیتوان با هم مقایسه کرد و هر روش دارای معایب و محاسنی میباشد. و در نهایت فصل پنجم با استفاده از راههاي پيشگيري و درمان بيپاسخي، پي ميگيريم.
2-1 مقدمه
در این فصل یکی از روش های مقابله با بی پاسخی واحدها كه ‌ترکیبی از دو روش پستی و حضوری است را بررسي ميكنيم. مسئله مورد نظر، تعیین تعداد پرسشنامه‌های پستی فرستاده شده و تعداد مصاحبه‌های حضوری انجام شده است. البته این کار بعد از خاتمه دوره دریافت پرسشنامه‌های پستی (به منظور رسیدن به دقت لازم) با حداقل هزینه انجام می شود.
اين روش در هر نوع روش جمعآوري اطلاعات می‌تواند به کار گرفته شود. به‌عنوان مثال، شاید مشکل بی پاسخی در آمارگیری پستی به‌اندازه مراجعات مکرر در مصاحبه‌ها، اهمیت داشته باشد که در حالت اخیر برای حداقل کردن هزینه به ازاء یک دقت معلوم، لازم است که نمونه بزرگتری از مصاحبه‌های اولیه را درنظر گرفته و به کسری از آنها که معمولاً در خانه نیستند، مراجعه شود. در بخش 2-2 بيپاسخي در نمونهگيري پستي را شرح ميدهيم و براي توضيح بيشتر مثالي را ذکرمیکنیم و در بخش 2-3 به بحث و نتيجهگيري ميپردازيم.
براي تدوين مطالب اين فصل از منبع هانسن و هورويتز(1946)، استفاده شده است .
2-2 بيپاسخي در نمونهگيري پستي
روش آمارگیری پستی به‌دلیل نرخ بی‌پاسخی زیاد، معمولاً یک اریبی نامعلومی را وارد نتیجه‌گیری‌ها می‌کند. در مصاحبه‌های حضوری معمولاً پاسخ کامل دریافت می‌شود، اما هزینه هر مصاحبه در مقایسه با روش پستی بسیار بالاست.
ابتدا روش نمونه گیری تصادفی ساده و شیوه‌های برآورد میانگین یا مجموع جامعه را توضیح می‌دهیم و این روش برای نمونه گیری با طبقه بندی و سایر روش‌های برآورد نیز به کار می رود.
براي مثال، فرض کنید می خواهیم تعداد کارمندان مغازه‌های خرده فروشی را طی یک دوره مشخص در یک استان، برآورد کنیم. فرض کنيد فهرستی از آدرس همه موسسات و مغازه‌هایی که دارای یک یا چند کارمند هستند دراختیار داریم. شیوه ای که گاهی اوقات اجرا می‌شود این است که نمونه ای از آدرس‌ها را از این فهرست انتخاب و پرسشنامه‌ها را برای آنها از طريق پست ارسال ميكنيم. سپس پرسشنامههائی که به‌دست ما رسیده را بررسي ميكنيم. حال اگر تعداد کارمندان را برای همه مغازه‌های خرده‌فروشی در استان به كمك اين پرسشنامهها، برآورد کنیم، اين برآورد، اریب خواهد بود.
اگر نرخ بی پاسخی خیلی زیاد باشد، اریبی خیلی جدی است. از طرفي ديگر به همه آدرس‌ها مأمور آمارگیری بفرستيم، هزینه جمعآوری داده‌ها خیلی زیاد خواهد بود. براي مثال فرض کنید هزینههاي آمارگيري نمونهاي به قرار زير باشند:
هزينة ارسالي هر پرسشنامه، 10 واحد پولي (مثلاً ريال، دلار، هزار ريال).
هزينه فرآوري پرسشنامههاي برگشتي، 40 واحد پولي.
هزينه مصاحبههاي ميداني هر پرسشنامه، 410 واحد پولي.
ولي فرض كنيم كه هزینه فرآوری هر پرسشنامه ای که با عملیات میدانی پر شده، 450 واحد پولی باشد. بنابراین اگر60 درصد پاسخ داشته باشیم به ازاء هزینه یک بار مراجعه در عملیات میدانی بايد تعداد 13پرسشنامه ارسال كردكه ازبين آنها 8 پرسشنامه برمي گردد. در حالی که اگر فقط 20 درصد نرخ پاسخگویی داشته باشیم، ميتوانيم 5 پرسشنامه دريافت كنيم.
بنابراين به ازاي يك مقدار هزینة ثابت ميتوان ‌اندازه نمونه را بین 5 تا 8 برابر بزرگتر از زمانی گرفت که از طریق مصاحبه حضوری انجام ميشود. البته این به معنای آن نیست که باید همه نمونه‌ها را با روش پستی جمعآوري كنيم.
در صورتيكه طرح نمونهگيري مناسب به كار رود و دادهها با دقت ثبت شوند معمولاً با افزايش نمونه خطاي برآورد كم ميشود. اما در مواردي كه بيپاسخي وجود داشته باشد. خطاي برآورد با افزايش نمونه زياد كاهش نمييابد.
مثال 2-1. فرض کنید پرسشنامه‌ها به یک نمونه 1000 تایی که به تصادف از یک فهرست 40000 تایی از مغازه‌ها استخراج شده‌اند، فرستاده شوند. همچنين فرض کنید 500 تا از آنها(50 % نمونه‌ها)، جواب می دهند و 500 تای دیگر، بی پاسخ‌اند. 10% مواردی که بی‌پاسخ بوده‌اند، انتخاب شده و به آنها مراجعه حضوری می‌شود. ميتوان فرض كرد که این نمونه ايي معرف از جامعه پرسشنامههاي پستی بيپاسخ هستند.
حال با استفاده از 550 پرسشنامه جمعآوري شده كه 500 تاي آنها از طريق پست و 50 تاي بقيه حضوري بودهاند، میتوان يك برآورد نااريب از تعداد كل كاركنان مغازههاي خردهفروشي بهدست آورد. این برآورد برابر است با
(2-1)
که در آن
40000 = : تعداد آدرس‌های موجود در فهرست .
1000 = : تعداد پرسشنامه‌های ارسال شده .
: متوسطتعداد‌کارکنان در هر مغازه برای مغازه‌هایی که به پرسشنامه پستی پاسخ داده‌اند.
500 = : تعداد مغازه‌هایی که به پرسشنامه پاسخ داده‌اند.
: متوسط تعداد کارکنان در هر مغازه که از مراجعات حضوری به دست آمده است.
500 = : تعداد پرسشنامه‌هایی که از بین پرسشنامه‌های اولیه، فرستادیم ولی به پرسشنامه پستی جواب نداده‌اند .
قضيه 2-1. واریانس نمونه ای ، در صورتی که روش نمونه گیری و شیوه برآورد مشخص شده باشند بهصورت زير است
(2-2)
كه:
: واریانس کل جامعه مغازه‌های اولیه است.
: واریانس كل مغازه‌هایی که به پرسشنامه پستی پاسخ نداده‌اند.
: تعدادي از مغازه‌های جامعه، که پرسشنامه پستی را جواب نمی‌دهند و آن تعدادي که در نمونه ميافتند را با s نشان ميدهيم.
: تعداد‌مغازه‌هایموجوددرنمونهکهبهپرسشنامةپستيپاسخندادهاند و از آنها مصاحبه حضوري به عمل آمده است و كسري از s است، يعني میباشد كه در آن عددي صحيح از بين اعداد است.
اثبات. چون

كه در آن ميانگين جامعه پاسخدهندگان و ميانگين جامعه بيپاسخهاست. پس

از آنجايي كه

كه متوسط بيپاسخهاي s است. درمطالب زيرفرض مي كنيم به ازاي و ثابت ، محاسبه شده است وبنابراين موقتا ثابت است ، يعني محاسبات را به شرط ثابت بودن انجام مي دهيم و نهايتا نسبت به تغييرات اميد مي گيريم .پس از جايگذاري رابطه فوق در معادله اصلي داريم

(1-2-2)
كه در اين معادله ، و ثابتاند و پس جمله وسطي برابرصفراست ، و جمله سوم برابر است با

با توجه به تعاريف و ازرابطه بالا اميدرياضي مي گيريم وداريم

مجددا ازرابطه شرطي بالا به شرط اميدرياضي مي گيريم تانتيجه غيرشرطي به دست آيد،بنابراين حاصل اميدرياضي برابراست با
(2-2-2)
از طرفي داريم
(3-2-2)
بنابراين با جايگذاري روابط (2-2-2) و (3-2-2) در معادله (1-2-2) خواهيم داشت

و اثبات تمام است.
به كمك فرمول (2-2)، به راحتی می توان نشان داد اندازه‌های متفاوتی از نمونه‌ها وجود دارند که قابلیت اعتماد آنها با هم برابرند. همچنين می توان به نقطه ای رسید که‌ اندازه نمونه به‌تنهایی شاخص ضعیفی از قابلیت اعتماد نمونه گیری خواهد بود.
فرض کنید يعني بخش بي پاسخ جامعه بخشي تصادفي ازكل جامعه باشد(بي پاسخي ربطي به صفت مورد اندازه گيري نداشته باشد) . اندازههاي N و S به قدر کافی بزرگ اند که و را بتوان برابر یک درنظر گرفت. هم چنین فرض کنید دقتی که لازم است آن قدر باشد که متوسط خطای نمونه گیری كه از 1000 نمونهحاصلميشود با فرض نرخ پاسخ دهی 100% ، برابر باشد. در این موقعیت اگر پرسشنامه‌ها را به نمونه تصادفی به حجم مغازه ارسال کنیم و نرخ پاسخ دهی 100% باشد، واریانس برآورد مجموع جامعه برابر است با:

که مانند بالا محاسبه می شود. بنابراین داريم

با مراجعه به جدول 2-1 ستون 5 آن براي ‌اندازه‌های نمونه متفاوت، دقت لازم در برآورد نمونه ای را به دست می دهد. مثلاً اگر 1500 پرسشنامه ارسال كنيم و بعد از فرآوري اين پرسشنامهها تعداد 1125 پرسشنامه تكميل شده بهدست آوريم، آنگاه خطاينمونهگيريحاصلازاين تعداد نمونه برابر حالتي است كه اگر 10000 پرسشنامه را ارسال كنيم و 5263 پرسشنامه تكميل شده بهدست آوريم (5000 پستي و 263 حضوري). بنابراين نتيجه ميگيريم، بهتر است بودجه اختصاص يافته به طرح نمونهگيري را از طريق مصاحبه حضوري صرف بهدست آوردن پرسشنامههاي تكميل نشده پستي كنيم.
ستون 6 جدول 2-1، هزینه کل برای هریک از‌اندازه‌های نمونه را تحت هزینه‌های واحد پولي (ريال، دلار، هزار ريال، …) نشان می دهد. اين جدول طوری تنظيم شده است که برحسب تعداد متغیرهاي واحدهای نمونهای، همه دقیقاً به یک مقدار از دقت در برآورد نمونهای (خطاي استاندارد) منتهی می شوند. بنابراين ‌اندازه نمونه را طوري اختیار ميکنیم که به حداقل هزینه منجر شود. همانطور كه در جدول ميبينيم، حداقل هزینه وقتی حاصل خواهد شد که 2000 پرسشنامه ارسال كرده و 1000 پرسشنامه تکمیل و برگشت داده شود (فرض كردهايم نرخ بی‌پاسخی 50% است) و همچنين333 پرسشنامهازبیپاسخی‌هاراباعملیات میدانی و مصاحبه حضوری تكميل و جمعآوري كنيم.
از اين مثال ميتوان مقدار هزینه برای تعداد نمونه نهایی ستون 5 جدول 2-1 را با استفاده از تابع هزینه بهدستآورد. این هزینهها را در ستون 6 جدول 2-1 آوردهایم. حال براي مقدار معلوم نرخ بيپاسخي، در بين انواع مختلف تركيبهاي ، و تركيبي را اختيار ميكنيم كه هزينه حداقل شود.

هزینه برحسب دلار تعدادنمونهنهایی
s m
(6) (5) (4) (3) (2) (1)
2550 1000 500 500 500 1000
2138 1125 375 750 750 1500
2099 1333 333 1000 1000 2000
2159 1563 313 1250 1250 2500
2250 1800 300 1500 1500 3000
2487 2286 286 2000 2000 4000
2751 2778 278 2500 2500 5000
4184 5263 263 5000 5000 10000
جدول 2-1. نمونههاي با اندازههاي متفاوت كه منجر به يك مقدار از دقت ميشوند. اين نمونهها مربوط به تركيب آمارگيري پستي و مصاحبة حضوري با فرض 50% نرخ بيپاسخياند.
كه در آن
هزينه ارسال هر پرسشنامه برحسب دلار : 10/0 =
هزينه فرآوري هر پرسشنامه برگشتي : 40/0 =
هزينه گردآوري و فرآوري اطلاعات پرسشنامههايي كه از طريقه مصاحبه تكميل شدهاند : 50/4 =
تعداد پرسشنامههايي كه ارسال شدهاند :
تعداد پرسشنامههايي كه پاسخ دادهاند :
تعداد بيپاسخها در نمونه :
تعداد مصاحبههاي حضوري از بين بيپاسخها :
حال در ادامه، تعداد بهينه پرسشنامههاي پستي و تعداد مراجعات حضوري را در يك قضيه ميآوريم.
قضيه 2-2. با توجه به تعاريف جدول 2-1 و تابع هزينه مفروض، تعداد بهينه پرسشنامههاي پستي و حضوري، و ، عبارتند از

و
(2-3)
كه در آن
(2-4)
و
(2-5)
كه در آن نرخ بيپاسخي و نرخ پاسخدهي به پرسشنامههاي پستي هستند.
اثبات.
در این قضیه میخواهیم هزینه را با توجه به واریانس ثابت، حداقل کنیم. برای این منظور با توجه به تابع هزینهای که قبلاً تعریف کردیم و بهصورت

است که در آن میباشد، و با استفاده از روش لاگرانژ مقادیر بهینه و را بدستمیآوریم. براي اين منظور داريم

که در آن را قبلاً تعریف کردهایم و است. حال معادلات مشتقات جزئی مربوط به پارامترهای و را به صورت زیر بدست میآوريم

از معادله داریم

حال ي به دست آمده را در معادله قرار میدهیم و خواهيم داشت

حال با محاسبات لازم داريم

ويا

ويا

بنابراين

كه در اين صورت مقدار بهينه بهصورت زير خواهد بود

حال براي بهدست آوردن مقدار بهينه از معادله استفاده میکنیم و با انجام محاسبات لازم داريم

ويا

بنابراين

حال با ساده كردن و از طرفين تساوي فوق داريم

ويا

بنابراين

از آنجایی که است با حل معادله فوق برحسب و در نتيجه مقدار بهينه به صورت زير خواهد بود

كه اثبات را كامل مي كند.
حالت خاص. در قصيه فوق اگر و باشند، آنگاه مقادیر بهینه و برابرند با
(2-6)
و
(2-7)
نكته. البته تعداد پرسشنامه‌های پستی و مصاحبه‌های حضوری که لازم است تا به یک دقت از پیش تعیین شده ای برسیم، با نرخ پاسخ دهی تغییر خواهد کرد. در عمل ممکن است حتی به طور تقریبی ندانیم نرخ پاسخ دهی چقدر است. در حالی که برای برآورد مقادیر بهينه از روی روابط بالا، نرخ پاسخ‌دهی تقریبی باید قبل از شروع آمارگیری معلوم باشد. وقتی نرخ پاسخ‌دهی قبل از شروع آمارگیری، معلوم باشد باز هم ممکن است بخواهیم طرح آمارگیری را طوری طراحی کنیم که حداقل به دقت از پیش تعیین شده یعنی به حداقل هزینه ممكن برسیم. و علاوه بر اين ميخواهيم هزینه آمارگیری را نيز محاسبه كنيم.
حتی در چنین شرایطی نیز ميتوان تعداد بهينه پرسشنامه‌هاي پستي و تعداد بهينه مصاحبه‌های حضوری که از بین بی پاسخی‌ها صورت می گیرد، را تعيين كرد.
جدول 2-1 با فرض نرخ پاسخدهي 50% حساب شده است. (نرخ پاسخدهي قبل از ارسال پرسشنامه فرض ميشود) گیریم مقادیر بهینه و را برای نرخ‌های پاسخ دهی متغیر از 10 % تا 90 % حساب کنیم در حالی که هنوز هم می خواهیم واريانس به همان ميزان قبل باشد.
مقادیر بهينه و از روی روابط (2-6) و (2-7) و هزینه‌های مربوط به آنها را در جدول2-2 آوردهايم. ستون 1 معرف نرخهاي پاسخدهي و ستون 4 معرف هزینه‌های یک آمارگیری عملیات توأم بهينه ارسال پستی و مصاحبه حضوری هستند.
اگر نرخ پاسخدهي نامعلوم باشد، دو روش براي تعيين تعداد بهينه پرسشنامههاي پستي و مصاحبه حضوري وجود دارد. در ادامه به بررسي اين دو روش ميپردازيم.
روش اول. در اين روش از صرفهجويي ارسال پرسشنامه پستي استفاده ميكنيم كه درستون 5 جدول 2-2 به عنوان هزينه روش 1 درج شده است . به اين صورت كه 1000 پرسشنامه ارسال ميكنيم و از تمام بيپاسخيها، بدون درنظر گرفتن نرخ بيپاسخي، مصاحبه حضوري بهعمل ميآوريم. (تعداد 1000 پرسشنامه، بهعنوان مثال انتخاب شده براي هر تعداد ديگر نمونه، روش محاسبه به همين ترتيب است)
حال فرض کنیم P برابر 10 % است. در این صورت خطای نمونه گیری عبارت است از :

به ازای هر نرخ پاسخ دهی مفروض، هزینه این روش همواره بیشتر از هزینه روش بهينه است. نتيجه ميگيريم زمانيكه بيپاسخي وجود دارد براي رسيدن به اين دقت حتماً بايد تعداد نمونه بيشتري از 1000 بگيريم. زيرا به واسطه بيپاسخي بايد تعداد ديگري را اضافه كرد تا كمبود دقت ناشي از بيپاسخي را جبران كند.
هزینه روش 1 برحسب دلار هزينه بهینه برحسب دلار r P
5 4 3 2 1
4.190 4.110 860 1.714 -6413563500010/0
3.780 3.558 711 1.989 20/0
3.370 3.035 575 2.034 30/0
2.960 2.544 451 1.979 40/0
2.550 2.096 341 1.870 50/0
2.140 1.690 245 1.727 60/0
1.730 1.328 163 1.564 70/0
1.320 1.010 95 1.386 80/0
910 731 40 1.197 90/0
جدول 2-2. نمونههايي كه منجر به دقت يكسان از طريق تركيب نمونهگيري پستي و مصاحبه حضوري از بيپاسخها ميشوند به ازاي نرخهاي بيپاسخي متفاوت.
جدول 2-2 نشان ميدهد به ازاي مقادير مختلف نرخهاي پاسخدهي، این روش چقدر پرهزینه‌تر از روش بهينه است. ستونهاي 4 و 5 نشان می دهند افزایش هزینه نسبت به روش بهينه برای نرخ‌های پاسخ‌دهی خیلی پایین ، كمترين مقدار است. زیرا تعداد پرسشنامه پستی کافی به دست نیامده است تا از مزایای اقتصادی پرسشنامه‌های پستی، بهره بگیریم. برای نرخ‌های پاسخ دهی 30% یا بیشتر اگر از روش 1 استفاده شود، افزایش هزینه ای معادل 10% تا 24 % خواهيم داشت.
روش محاسبه هزينهها براساس روش محاسبه هزينه در جدول 2-1 ولي به ازاي نرخهاي پاسخدهي متفاوت، ميباشد.
روش دوم. در اين روش از صرفهجوييهاي ارسال پرسشنامههاي پستي بيشتر بهره ميگيريم. براي تعيين تعداد بهينه پرسشنامههاي پستي و مصاحبههاي حضوري،طي دو مرحله اين كار را انجام ميدهيم.
مرحله اول. بدون درنظر گرفتن نرخ پاسخدهي، ماكزيمم تعداد پرسشنامههاي ارسالي را تعيين ميكنيم. (فرض ميكنيم پاسخدهي كامل است و به روش تعيين حجم نمونه در آمارگيريهاي نمونهاي، مقدار نمونه را تعيين ميكنيم)
مرحله دوم.تعیین تعدادی است که باید مصاحبه حضوری شوند تا به دقت مطلوب برسیم. پس از آنکه تعداد ماکزیمم پرسشنامه‌ها را ارسال كرديم، نرخ پاسخ دهی از روی نمونه‌های برگشتی تعیین ميشوند. بنابراین تعدادی که باید مصاحبه شوند با نرخ پاسخ دهی که عملاً به دست آمده، متغیر خواهد بود.
با مراجعه به ستون 2 در جدول 2-2، ملاحظه می کنیم برای مسئله مورد بررسي ماکزیمم تعداد پرسشنامه‌هایی که (صرف نظر از نرخ پاسخ دهی) باید ارسال شود برابر 2034 پرسشنامه است. اگر 40% پاسخ داده باشند با استفاده از فرمول (2-3) می بینیم تعدادی که باید مصاحبه حضوری از آنها به عمل آید 448 خواهد بود.
جدول 2-3 به ازای مقادیر متغیر نرخ‌های پاسخ به پرسشنامه‌های پستی، تعداد مصاحبه‌های حضوری که باید انجام شوند تا به دقت مطلوب برسیم در صورتی که 2034 پرسشنامه پست شده باشند و هزینه کل برای هر کدام از این نرخ‌های پاسخ‌دهی را نشان می دهد.
هزينه بهينه برحسب دلار هزينه روش 1 برحسب دلار هزينه روش 2 برحسب دلار r p
6 5 4 3 2 1
4.110 4.190 4.119 852 203 10/0
3.558 3.780 3.561 710 407 20/0
3.035 3.370 3.035 575 610 30/0
2.544 2.960 2.545 448 814 40/0
2.096 2.550 2.100 331 1.017 50/0
1.690 2.140 1.713 227 1.220 60/0
1.328 1.730 1.390 137 1.424 70/0
1.010 1.320 1.151 66 1.627 80/0
731 910 1.017 18 1.837 90/0
جدول 2-3.مقايسه بين هزينه‌هاي بهينه، روشهاي 1 و 2 در صورتيكه نرخ پاسخدهي معلوم باشد.
مقایسه ستون 4 با ستون 6 در جدول 2-3، نشان می دهد که به استثناء نرخ‌های پاسخ‌دهی خیلی بالا، فقدان هر نوع آگاهی قبلی از نرخ‌های پاسخ دهی، تقریباً هیچ نوع هزینه اضافی نسبت به مقادیر روش بهينه وقتی که نرخ پاسخ دهی‌ها نامعلوم باشند، ندارد. البته وقتی نرخ‌های پاسخ‌دهی بالا باشند، هزینه کل آمارگیری، کم خواهد بود حتی اگر تعداد خیلی زیاد و غیرضروری از پرسشنامه‌ها، در ابتدای کار پست شده باشند.
بدین‌ترتیب نه تنها می توان مقادیر بهینه و را برای وقتی که نرخ پاسخ دهی از قبل معلوم است پیداکرد، بلکهیکروشبهینهرامیتوانیافتبهطوریکهحتیاگردرباره نرخ پاسخ‌دهی هیچ اطلاعی نداشته باشیم، آن را بهکار برده و این روش حداقل دارای همان دقت از پیش تعیین شده و با هزینه کم است.
البته اگر نرخ پاسخ دهی از قبل به طور تقریبی معلوم باشد، استفاده از این اطلاع در تعیین تعداد بهینه پرسشنامه‌های پستی و مصاحبه‌های حضوری منجر به‌اندکی کاهش در هزینه خواهد شد.
حال به ذکر چند نکته درباره استفاده از روش فوق میپردازیم.
در عمل آمارگیری پستی محدودیت زمانی دارد. همه پرسشنامه‌هایی که قبل از پایان مهلت مقرر می رسند پاسخ‌های پستی را تشکیل می دهند و نسبت نمونه گیری میدانی برای پیگیری، باید در مورد آن پرسشنامه‌هایی باشند که تا این تاریخ پاسخ آنها دریافت نشدهاند. تعداد‌اندکی که بعد از آن تاریخ می رسند باید از نمونه حذف شوند تا از اریبی حاصل از بی‌پاسخی که وجود دارد، جلوگیری شود. مگر آنکه این نمونه‌ها برای مصاحبه حضوری تعیین شده باشند. البته تاریخ آخرین مهلت باید طوری تعیین شود که تعداد قابل توجهی از پرسشنامه‌های پستی برسند تا از مزیت اقتصادی آمارگیری پستی کاملاً بهره گیری شود. پس از انتخاب نمونه برای پیگیری‌های میدانی و مصاحبه با نمونههای فوق، هر پرسشنامهی رسیده دیگر را نباید درنظر بگیریم مگر آنکه جزء نمونه‌های مصاحبه حضوری باشد.
نکتهدیگرآناستکهروشبهینهیمورد نظر برای روش نمونه گیری تصادفی ساده است ومیتواند برای روشهای نمونه‌گیری دیگر بهکار رود. مثلاً برای نمونهگیری طبقهبندی، میتوان معادلاتی مشابه روابط (2-3)، (2-4) و (2-5) برای هر طبقه بهدست آورد. از آنجایی که در اینپایاننامه روش نمونهگیری تصادفی ساده مورد نظر بوده است، لذا خواننده علاقهمند میتواند به هانسن وهورويتز (1946) مراجعه کند.
2-3 خلاصه و نتیجه‌گیری
همانطورکه در این فصل دیدیم، با استفاده از روش ترکیب نمونهگیری پستی و حضوری، توانستیم اریبی ناشی از بیپاسخی را به کمترین مقدار برسانیم. مسئله مهم تعیین تعداد پرسشنامه‌های پستی است که باید ارسال شوند و پس از دریافت پرسشنامه های پستی در پایان دوره نمونه‌گیری تعداد مصاحبه هایی است که باید حضوری انجام شوند. با این روش هزینه مراجعات مکرر را به ازای یک دقت معلوم برای برآوردها حداقل می کنیم. این کار با انتخاب نمونه ای بزرگتر از تعداد نمونه لازم و انجام مصاحبه با کسری از کسانی که پاسخ نداده اند، انجام میگیرد.
نتايج طرح A را با نتایج عملیاتی که از ابتدا برای مراجعه به 10000n= نفر و تا پنج بار مراجعه مکرر به قصد یافتن غایبین از خانه (طرح B) طراحی شده مقایسه ميكنيم. نتايج در جدول3-5 توصیف شدهاند.
تعداد کل مراجعات به خانه‌ها در هر طرح یکسان است. به اندازه همه مراجعات تحت طرح A مراجعات بار اول وجود دارد، در حالی که حدود 4500 مراجعه تحت طرح B از نوع مراجعات مکررند. طرح B داراي کار میدانی بیشتری است.
حال به كمك جدول 3-5 ميتوانيم واريانسهاي برآوردهاي مورد نظر را به صورت زير محاسبه كنيم كه نسبت دارندگان صفت مورد مطالعه در دو طرح داراي برآورد يكساني است و داريم

1.006
طبق فرمول واريانس كه در معادله 3-19 داده شده داريم

Author:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *