آمار به زبان ساده –انتخاب نمونه‌ها برای مقایسه

23 شهریور 1400

دقیقه

فصل 7: انتخاب نمونه‌ها برای مقایسه آزمون فرض با یک نمونه وقتی به کار برده می‌شود که جمعیت ویژه‌ای را بشناسیم و می‌خواهیم تصمیم بگیریم که آیا نمونه از یک جمعیت دیگر آمده است یا خیر، در اغلب تحقیق‌ها بطورکلی ما هیچ جزئیاتی از جمعیت در دست نداریم. آنچه میدانیم نمونه‌ای است که در دست...

فصل 7: انتخاب نمونه‌ها برای مقایسه

آزمون فرض با یک نمونه وقتی به کار برده می‌شود که جمعیت ویژه‌ای را بشناسیم و می‌خواهیم تصمیم بگیریم که آیا نمونه از یک جمعیت دیگر آمده است یا خیر، در اغلب تحقیق‌ها بطورکلی ما هیچ جزئیاتی از جمعیت در دست نداریم. آنچه میدانیم نمونه‌ای است که در دست داریم. در غالب موارد آزمون فرض درباره مقایسه نمونه‌ها و نه مقایسه میانگین نمونه‌ با توزیع نمونه‌گیری است. در مثال گاز سایدامین که در فصل قبل ملاحظه نمودید ما جزئیات وزن زمان تولد جمعیت کودکان آلوده نشده به گاز را داشتیم.

بیشتر اوقات معمولا ما چنین اطلاعاتی را نداریم و تنها می‌توانیم جمع‌آوری کنیم. البته شکل انتخاب نمونه وقتی که دو تا باشند سخت‌تر از یکی است زیرا نیاز است که هرکدام نمایانگر جمعیت باشند. مسلماً این واقعیتی است که ما می‌خواهیم نمونه‌هایمان را برای برآورد جمعیتی به کار ببریم که این امر به خودی خود مسائلی را در انتخاب نمونه باعث می شود. به طوریکه نمی‌خواهیم اریبی ایجاد شود که باعث شود نمونه‌هایمان، نماد جمعیت‌هایشان نباشند.

وقتی دو نمونه داریم تنها نمی‌خواهیم که نمایانگر جمعیت‌های مربوطه‌شان باشند بلکه می‌خواهیم قابل مقایسه هم باشند. برای مثال اگر میزان سلامتی مردان و زنان چهل ساله را مقایسه می‌کنیم نباید زنان قهرمان ورزشی و مردان راننده تاکسی را انتخاب کنیم چون آنها قابل مقايسه نيستند. هر تفاوت در سلامتي به آساني مي‌تواند بدليل شغلي و نه جنسيتي باشد. اين مشكل قابل مقايسه بودن است كه اكنون مورد ملاحظه قرار مي‌دهيم.

طراحي آزمونها براي مقايسه نمونه‌ها

دليل بر عهده گرفته آزمونها اين است كه مي‌خواهيم فرض را بيازمائيم علت مهم براي نگراني آن است كه آيا آزمون واقعاً فرضي را كه مي‌خواهيم ارزيابي شود مي‌آزمايد تا بقيه را محروم كنيم يا اينكه بطريقي اریبی را  ایجاد کرده ایم. انتخاب ضعيف نمونه‌ها مي‌تواند منجر به يك آزمايش مبهم گشته، اگر ما قادر نباشيم تصميم بگيريم كه آيا تفاوت در سلامتي مربوط به شغل است يا جنسيت.

متغيرهاي آزمايش

همه‌ آزمايشات به اثرات متغيرها يا فاكتورها،به عنوان دو اصطلاح با كاربرد مترادف، نگاه مي‌كنند. متغيرها روشن است يعني چيزهائيكه تغيير مي‌كنند: دما، زمان پاسخ دهي، روشهاي تدريس، جنسيت، كلاس، عادات آشاميدن، كيفيت كارآيي، تنها چند نمونه كوچك هستند.

در ساده‌ترين حالت آزمون فرض مي‌خواستيم بدانيم كه آيا يك نمره از يك توزيع شناخت شده مي‌آيد يا از توزيع جمعيت متفاوتي می آید. يك مثال مقايسه زمان پاسخ‌دهي (یا عکس العمل) فردي پس از مجروحيت در ناحيه سر با جمعيت در زمان‌هاي پاسخ دهي افرادي از جمعيت سالم مي‌باشد. همچنین می توان میانگین نمونه را با با توزیع میانگین نمونه ها که از توزیعی شناخته شده آمده اند نیز مقایسه کرد. بعنوان مثال ممكن است ميانگين نمرات بهره‌هوشي كودكاني را كه با روش جديد درست خوانده‌اند با توزيع ميانگين‌ نمونه‌هايي با همان اندازه از كودكاني كه با روش سنتي آموزش ديده‌اند را با هم مقايسه كنيم. در هر دوی اين حالتها ما به يك توزيع شناخته شده نياز داريم. معمولا دو یا چند نمونه را در مورد موضوعی که مد نظر ماست مقایسه می کنیم و تصمیم می گیریم که نمونه ها از یک جمعیت آمده اند یا نه. براي نمونه آيا حافظه زنان و مردان در مورد حافظه تصويري تغيير مي‌كند. توجه كنيد كه لغت گروه در اين شرايط خيلي ساده به عضوي از يك نمونه اشاره داردموضوع یا گروه مي‌تواند هر چيزي باشد. بيشتر اوقات مي‌تواند يك شخص بوده اما مي‌تواند يك حيوان هم باشد (اگر ما نرخ يادگيري راه‌هاي پيچ در پيچ و يا شگردهاي آموزش  به سگها را مطالعه مي‌كنيم)، يا به طور قطع هر چيزي را كه مورد مطالعه قرار مي‌دهيم. (گلوله‌هاي ساخته شده با يك ماشين در يك نمونه و گلوله‌هاي ساخته شده با ماشين ديگر در نمونه دوم).

استفاده از اصطلاح موضوع در مطالعات روانشناسي هنگاميكه اشخاصي موافقت مي‌كنند كه در تحقيق شركت نمايند مورد انتقاد قرار گرفته است. در واژگان شناسي جديد چنين شخصي مشاركت كننده (یا شرکت کننده)ناميده مي‌شد زيرا او به عنوان فرد محترم تري از افراد شركت كننده مفيد در نظر گرفته مي‌شود كه بدون آنها تحقيقات كمي در زمينه روانشناسي تحقق مي‌يافت. بهر حال در تحليلهاي آماري براي نوعهاي خاصي از طراحي و محاسبات از عناوين « بین گروهی ها» و « درون گروه ها» ياد مي‌كنيم تا اصطلاحات در چنين شرايطي نيز جريان داشته باشند. آنجائيكه مشخص است كه افراد در مطالعه شركت كرده‌اند من از آنها به جاي موضوع به عنوان مشاركت‌كننده ياد مي‌كنم.

در مثالي كه تاكنون مورد ملاحظه قرار داديم هر آزموني حداقل دو فاكتور داشت. در مثال گاز سايدامین يك متغيير گاز سايدامين بود كه بين آلوده و غيرآلوده در نوسان بود و ديگري وزن زمان تولد، كه ميان افرادي كه وزن آنها را گرفته بوديم تغيير مي‌كرد. در مثال بالاي آزمون حافظه، جنس را داشتيم كه مرد بود يا زن و حافظه تصويري كه باندازه معیاری كه براي سنجيدن آن اختراع شده متغير بود.

در آزمايش ممكن است يك يا چند متغير مستقل وجود داشته باشد. اينها متغيرهايي هستند كه آزمون گيرنده آنها را بيشتر بخاطر مقاديرشان بر مي‌گزيند. در مورد متغير گاز سايدامين انتخاب ما اين بود كه به دو مقدار نظر بيفكنيم:‌ آلوده و غيرآلوده (نه اينكه بگوئيم بشدت آلوده، آلوده متوسط، كمي آلوده) در مورد متغير جنس ، ما زن و مرد را برگزيديم ( و نه پسر و دختر). آزمون گيرنده مقادير متغيرهاي مستقل را كنترل مي‌كند و نمونه‌ها جوري برگزيده مي‌شوند كه در اين مقادير متفاوت باشند.

همانند متغيرهاي مستقل، در یك آزمون متغيرهاي وابسته هم وجود دارند. در حاليكه محقق فاكتوري را بعنوان متغير مستقل بر مي‌گزيند (وزن ، زمان تولد ، زمان پاسخ‌دهي، نمره بهره‌هوشي، حافظه تصويري) اما نمي‌تواند مقادير آن متغير را كنترل كند.

مقاله های مرتبط:   مدل سازی ساده با اکسل “تابع LOOKUP”

ما پيشاپيش نمي‌دانيم كه نمره اين متغير چه خواهد بود. اين دلیلی است كه برای آن آزمون انجام مي‌دهيد. اجازه دهيد مثالي از دو نمونه را مورد ملاحظه قراردهيم. دو گروه از كودكان با دو روش متفاوت مشغول آموزش زبان دوم هستند. آيا يك روش از روش ديگر بهتر است.

در اصطلاح آماري ما مي‌خواهيم متغير وابسته مناسب را بيابيم (مثلاً مقداري كه آموخته‌اند) كه به متغير مستقل وابسته است (يعني روش آموزش) تا ببينيم كه آيا مقدار متغير وابسته در دو نمونه‌ها به شكلي متفاوتند كه بتوان نتيجه گرفت كه نمرات نمونه از توزيع‌هاي متفاوتي مي‌‌آيند و يك روش آموزش به بازده بيشتري از ديگري مي‌انجامد.

مشكل شرايط یکسان

آزمونها همه درباره پيش‌بيني رابطه بين متغيرهاي مستقل و وابسته هستند. فرض تحقيق يك پيش‌بيني است كه مي‌گويد متغير وابسته با تغيير در متغير مستقل تغيير مي‌كند در نظر بگيريد كه آزمايشي را براي اينكه ببينيم آيا دختران در خواندن نقشه بهتر از پسران هستند ترتيب دهيم. اولين مسئله آن است كه منظور ما از خواندن نقشه چيست، خواندن نقشه جاده‌ها براي رسيدن به شهر؟ خواندن يك نقشه نظامي براي رفتن از یک سوی شكارگاه به سوی دیگر؟ جواب ساده‌اي براي پاسخ به اين سوال وجود ندارد. بايد انتخابي كرده و بوضوح آن را اظهار كنيم. همانگونه كه در فصل 4 ديديم بايد به صورت عملياتی قابليت خواندن نقشه را براي هدف آزمون خود تعريف كنيم مثل اينكه بگوئيم: زمانيكه طول مي‌كشد تا يك بچه از يك كليسا در دشت با استفاده از نقشه نظامي به يك اداره پست خاص برود. مي‌بايست شرايط را به صورت يكسان براي همه كودكان ترتيب دهيم مثلاً مطمئن شويم هيچ يك از آنها مسير را بلد نيست. و اين مسئله مشكل دوم را روشن مي‌كند.

اگر ما تفاوتي ميان پسران و دختران در قابليت نقشه خواني يافتيم: آيا مي‌توانيم رابطه‌اي بين جنسيت و قابليت نقشه خواني استنتاج كنيم؟ لزوماً نه. علت آن ، مشكل بودن ترتيب شرايط مساوي براي پسران و دختران است. اگر دختران كار را در روشنايي روز انجام داده و پسران آن را در تاريكي، تعجبي نخواهيم كرد كه نتايج پسران ضعيفتر باشد در چنين حالتي متغير مستقل جنسيت با متغير روشنايي روز آميخته شده است.

همينطور اگر پسران از يك باشگاه صحرا نوردي با قطب‌نما بوده و دختران هرگز حتي پيش از آن نقشه‌اي را نديده با شند آنگاه يك تفاوت ميان آنان، لزوماً دلالت بر رابطه‌اي ميان قابليت نقشه خواني با جنسيت نخواهد داشت بلكه در اينجا رابطه‌اي ميان قابليت نقشه خواني و تجربه وجود دارد.

اختلاط يك مثال از خطای سيستماتيك است. شرايط آزمون به صورت يكساني براي هر دو نوع بدليل ديگر متغيرهاي مستقل همانند آني كه در حال آزمون است متفاوت است. افزون بر خطاهاي سيستماتيك تأثيرگذار بر آزمون، ما خطاهاي تصادفي هم داريم. اين‌ خطاها به صورت غيرسيستماتيك رخ مي‌دهند. يك باد نابهنگام موقتاً خواندن نقشه را براي يك پسر سخت مي‌كند، جاده براي يك دختر هنگام عبور از آن شلوغ است ولي براي ديگري خلوت.

از آنجا که بنظر مي‌رسد هرگز نتوانيم شرايط مساوي براي همه شركت‌كنندگان در تحقيق فراهم كنيم آيا بايد همه آزمونهاي همگاني را رها كنيم؟ متأسفانه هيچ روش تحقيق بدون مشكلي وجود ندارد اما راه‌هايي براي مقابله با اين مشكلات وجود دارد. خطاهاي سيستماتيك وقتيكه ما از وجود آنها آگاه هستيم اجتناب پذيرند و اين به مهارت محقق در مشخص نمودن آنها بستگي دارد. مي‌توانيم متعمداً شركت‌كنندگان را جوري انتخاب كنيم كه با يك متغير اختلاط گر مطابقت داشته باشند. در مثال خودمان، هر پسري را كه تجربه نقشه خواني دارد با يك دختر كه او نيز چنين تجربه‌اي دارد مطابقت ‌دهيم. بدين روش نمونه‌ها در آزمايش تفاوتي نخواهند داشت و ديگر نتايج ما جانبداري نسبت به يك نمونه خاص نخواهد داشت. همچنين انجام آزمايش در روز را مراقبت كنيم و مطمئن شويد كه همه كودكان آزمايش خود را در شرايط مساوي روشنايي روز انجام داده‌اند. با كمي پخته‌تر  عمل كردن در طراحي و اجراي آزمايش، مي‌توانيم خطاهاي سيستماتيك مربوط را از سر راه برداريم.

خيلي غير محتمل است كه بخواهيم كودكان در رنگ موهايشان هم مشابه باشند چون انتظار نمي‌رود كه اين فاكتور در اين آزمايش موثر باشد. در مطابقت تنها فاكتورهايي را در نظر مي‌گيريم كه معتقديم مرتبط هستند. مجدداً ملاحظه مي‌فرمائيد كه دانش و خبرگي شخص در زمينه تحقيق است كه اين قضاوتها را هدايت مي‌كند و نه دانش‌آماري او بدين دليل است كه آزمايش بايد بدقت گزارش شود تا مشخص كند كه نمونه‌ها چگونه مطابقت داده شده‌اند زيرا محقق ديگري ممكن است ادعا كند كه يك فاكتور گيج‌كننده مهم در آزمايش كنترل نشده است

نمي‌توان خطاهاي تصادفي را كنترل نمود، ولي بهرحال آزمونهاي آماري ما، متعهداً به شكلي طراحي شده‌اند كه به ما كمك كنند تا تصميم بگيريم كه آيا ميان نمونه‌هايمان تحت تاثیر هرگونه «اغتشاش پنهان»‌اي كه بوسيله خطاهاي تصادفي ايجاد شده ، اختلافی وجود دارد يا خير؟ و براي اين كار يك سطح معنی داری مشخص مي‌كنيم. انتظار نداريم كه هر پسر و دختري نمره يكسان بگيرند. بلكه انتظار توزيع نمرات را داريم: هر پسري با يك سرعت مي دود و همه دخترها هم در جاده‌ها مسافرت نمي‌كنند. خطاهاي تصادفي توزيعی از نمرات در همه نمونه‌ها ايجاد مي‌كنند آزمونهای  آماري بدنبال تفاوتهاي سيستماتيك ميان نمونه‌ها مي‌گردند که متغيرهاي مستقل تحت تاثیر تغييرات تصادفي در يك نمونه. ایجاد کرده اند.

نمونه‌هاي مستقل و وابسته

گاهي اوقات همانند آزمايش نقشه‌خواني، شركت‌كنندگان متفاوتي در هر نمونه وجود دارند. در رابطه با متغير جنسيت تعجب‌آور نيست كه كودكان يا دختر هستند و يا پسر و نه هر دوي آن در بعضي آزمايشهاي ديگر ممكن است يك شركت‌كننده در همه نمونه‌ها مشاركت داشته‌باشد. يك مثال از اين نوع مي‌تواند يك آزمايش براي مشخص كردن تأثير دما براي ادراك خواندن باشد جائيكه ادراك شركت‌كنندگان را در دو درجه‌ حرارت مختلف مورد آزمون قرار مي‌دهيم. وقتيكه يك شركت‌كننده تنها با يك نمره در يك نمونه مشاركت كند آنرا غير وابسته، مستقل يا طرح بين گروه ها مي‌ناميم و هنگاميكه يك شركت‌كننده با يك نمره براي هر نمونه شركت كند آزمايش وابسته، سنجش‌هاي تكراري و يا طرح درون گروه ها ناميده مي‌شود. اكنون به آزمايشي توجه كنيد كه محقق تلاش مي‌كند دريابد آيا نوشته های جوزف كنرداد (مشهور به مشكل بودن نوشته‌هايش) در مقايسه با چارلز ديكنز مشكل‌تر است، محقق ممكن است قطعه‌اي از نوشته‌هاي هر دو نويسنده را (كه حداقل يك اندازه باشند) انتخاب كرده و آن را به گروهي از شركت‌كنندگان داده تا بخوانند و بدنبال آن يك آزمون درك مطلب بدهند.

مقاله های مرتبط:   175 راه برای انجام کار بیشتر در زمان کمتر "فصل اول"

اين يك طراح وابسته است زيرا هر شخص در هر دو نمونه حضور دارد. اين روش از جهت مطابقت شركت‌كنندگان با خودشان مزيت دارد. بنابراين خطاهاي ممكن ناشي از تفاوت بين افراد را كاهش مي‌دهد (مثلا همه آدمهاي متعصب روي زبان انگليسي را در يك نمونه نداريم) اما مشكلات ديگري وجود دارد كه بايد مراقبت آنها بود. اگر شركت كنندگان در ابتدا متن ديكنز و سپس متن كنرداد را بخوانند ممكن است در مورد متن ديكنز از لحاظ درك مطلب عملكرد ضعيفتري نشان بدهند، نه بدليل قابل درك نبودن ، بلكه چون آن را در ابتدا خوانده‌اند و اكنون در ذهن آنها نيست.

ما فاكتور  اختلاط گری به نام مدت حافظه در اين آزمايش معرفي كرده‌ايم. براي فائق آمدن بر اين مشكل، مي‌بايستي در ترتيب خواندن موازنه ايجاد كنيم. بنابراين نيمي از شركت‌كنندگان در ابتدا متن ديكنز را مي‌خوانند و نيمي ديگر متن كنرداد را ، با اين گونه موازنه برقرار كرد ن، فاكتورهاي  اختلاط گری همچون مدت حافظه ، خستگي، كسالت‌آاور بودن، تجربه امتحان و غيره را كنترل مي‌كنيم.

مزيت طراح مستقل آن است كه  اثر منتقل شونده‌اي از يك نمونه به نمونه ديگر وجود ندارد، در حاليكه نكته منفي آن است كه ممكن است تفاوتهاي سيستماتيكي بين نمونه‌ها وجود داشته باشد. بنابراين ما بايد در انتخاب نمونه‌هايمان مراقب باشيم. در بسياري از حالات وقتيكه يك متغير مستقل مانند جنسيت يا شغل را مي‌آزمائيم يعني جائيكه شركت‌كنندگان تنها مي‌توانند عضو يك نمونه باشند، مي بايستي طراحي مستقل را داشته باشيم. مردم يا به عنوان دكتر كار مي‌كنند و يا به عنوان پرستار و نه هر دوي آنها.

 تفسير تفاوتهاي نمونه

اساساً در طراحي آزمايشها، مايليم كه موضوعات مورد آزمايش  خود را از بزرگترين جمعيت ممكن انتخاب كنيم. اگر اين کار را انجام دهيم نتايج ما بيشترين قابليت عمومي شدن را دارا هستند. ولي به همان نسبت بزرگترين شانس ایجاد اختلاط را نيز داريم. محققين توافق مي‌كنند (زيرا آنها بايد هر روشي را به كار بگيرند) و مقداري از قابليت عمومي شدن را به خاطر كنترل بيشتر بر روي متغيرهاي در دست، از دست مي‌دهند. در مثال گاز سايدامين ما بچه‌هائي را كه گاز در آن شهر پراكنده شده بود مورد آزمايش قرار داديم. اين مثال را نمي‌توان به همه بچه‌هاي تحت تأثير گاز سايدامين تعميم داد. ممكن است چيزي مختص به اين موقعيت مكاني موجود باشد كه اثر گاز را به نحوي تشديد كرده باشد. اما اين موجب نمي‌شود كه محققين آزمايش را متوقف كنند. هنوز اطلاعات مهمي را مي‌توان يافت و البته نياز است كه تأثير موقعيت مكاني در افزايش اثرات گاز سايدامين روشن شود. در نهايت در اين بخش ما مي‌خواهيم آزمايشي را طراحي كنيم  كه واقعاً فرضي را كه ما مايليم مورد بررسي قرار دهد. (جالب است بدانيد كه چقدر زياد اينگونه نمي‌شود). اگر بخواهيم كه ببینیم كه يك الگوي مطالعه خواندن كودكان را بهبود مي‌بخشد يا خير؟  پس از اينكه در اين الگوی مطالعه مشاركت كردند به راحتي نمي‌توان آنها را قبل و بعد از مشارکت ، مورد آزمايش قرار داد. هر تفاوتي ممكن است مربوط به آن باشد كه كودكان شركت‌كننده در طرح سن بيشتري داشته باشند. و الگوي مطالعه علت آن نباشد در اينجا ما فاكتور  اختلاط گر سن را داريم. براي غلبه بر اين مشكل دو گروه از كودكان را كه در قابليت خواندن مطابق باشند. انتخاب كرده، به يك گروه از آنها یعنی گروه آزمایشی الگو را داده و به گروه دیگر یعنی گروه کنترل نمی دهیم اگر خواندن گروه آزمايشي بيشتر از گروه كنترل بهبود يافت آنگاه مي‌توانيم آن را به الگوي مطالعه ربط دهيم زيرا ما تأثير آن را با انتخاب گروه كنترل، مهار كرده‌ايم.

در همه آزمايشها تلاش مي‌كنيم تا بين متغيرهاي مستقل و وابسته رابطه ايجاد كرده و متغيرهاي خارجي را كه مي‌توانند بر اين رابطه تأثير بگذارند كنترل كنيم.  بايد مراقب باشيم هنگاميكه رابطه‌اي را مي‌يابيم تفسير ما دچار خطا نشود. آزمايشها روابط علی و معلولی را ايجاد نمي‌كنند ، آنها تنها فرضهاي قابل آزمون را تائيد يا رد مي‌كنند. براي مثال ممكن است تفاوت مردان و زنان در يك فاكتور خاص را فرض قرار دهيم. اگر تفاوت معناداري يافتيم فرض ما را تائيد مي‌كند اما علت آنرا به ما نمي‌گويم. دليل ممكن است ژنتيك،‌ اجتماعي يا حتي يك فاكتور  اختلاط گر باشد كه ما روي آن حساب نكرده‌ بوديم.

علت انجام آزمونها اين است تا آنها به ما مقداري داده سيستماتيك بدهند كه پايه قضاوت‌ها و تست ايده‌هايمان بشود. هر چه بيشتر درباره روشهاي آزمايش بياموزيم قضاوت‌هاي ما در ارزيابي يافته‌هايمان پخته‌تر خواهند شد. و اين تحليل آماري است كه به ما كمك مي‌كند تا تصميم بگيريد كه واقعاً چه يافته‌ايم.

اشتراک گذاری در شبکه های اجتماعی
@

لطفا شکبیا باشید...