آمار به زبان ساده – معنی داری، خطا و توان

11 مهر 1400

دقیقه

فهرست محتوا پنهان توان يك آزمون تأثيري‌گذاري اندازه اثر اندازه‌ نمونه تصویر 9.1- خطای نوع اول و دوم اگر نمره ما زیر سطح معنی داری (عقب تر از آن) بیفتد فرض صفر پذیرفته می شود بدین معنی که توزیع ما یک توزیع شناخته شده است. چنانچه بار دیگر به نمودار 9.1 نگاه کنیم در میابیم...

آمار به زبان ساده

آخرین به‌روزرسانی: 24 دی 1401

فهرست محتوا پنهان

توان يك آزمون

تأثيري‌گذاري اندازه اثر

اندازه‌ نمونه

تصویر 9.1- خطای نوع اول و دوم

اگر نمره ما زیر سطح معنی داری (عقب تر از آن) بیفتد فرض صفر پذیرفته می شود بدین معنی که توزیع ما یک توزیع شناخته شده است. چنانچه بار دیگر به نمودار 9.1 نگاه کنیم در میابیم که در 95 درصد از موارد توزیع شناخته شده زیر سطح معنی داری قرار می گیرد. همچنین زیر سطح معنی داری بیشتر از اینکه توزیع ناشناخته داشته باشیم توزع شناخته داریم، بنابراین این احتمال وجود دارد که اگر نمره(آماره بدست آمده) به بخش سطح معنی داری تعلق دارد از توزیعی شناخته شده آمده است و صحیح است که فرض صفر را بپذیریم.

ما باید تصویر روشنی از آنچه که مستلزم “قبول فرض صفر” است داشته باشیم. در حالت کلی “قبول” بدین معنی است که تفاوت معنی داری در آزمایش نیافته ایم. در حقیقت بعضی از نویسندگان ( کاهن، 1988، صفحه 16، همچنین ویلکینسون و نیروی کار در استنباط آماری، 1999) دلایلی آورده اند که گفتن اینکه فرض صفر پذیرفته می شود اشتباه است، بلکه همیشه باید بگوییم “فرض صفر را نمی توان رد کرد” زیرا بیان موقعیت به این صورت دقیق تر است و در واقع می گوییم دلیل کافی جهت رد فرض صفر نیافته ایم. در این حالت به طور یقین نشان نداده ایم که فرض صفر صحیح است. می توان ادعا کرد که دلیلی برای گفتن اینکه فرض درست است وجود ندارد، و ميان اين دو جمله تفاوت ظريفي وجود دارد. مجدداً مي‌گوئيم اگر ما در حفاري خود در جزيره گنج، گنجي نيابيم اين بدان معنا نيست كه در هيچ جايي اين جزيره گنج وجود ندارد. وقتيكه فرض صفر را مي‌پذيريم فقط مي‌گوئيم كه تفاوت به اندازه كافي بزرگ نيافته‌ايم تا احتمال بوجود آمدن اختلاف بوسيله شانس را رد كنيم. احتمال اختلافي ناشي از شانس در توزيع آنقدر براي ما بزرگ است كه نمي‌توانيم اختلاف حقیقی در توزيع‌ها را ادعا كنيم. اگر ما گنجي نيافتيم دو احتمال ممكن است: اول در آنجا اصلاً گنجي وجود ندارد يا دوم در آنجا گنج وجود دارد ولي ما هنوز آنرا نيافته‌ايم. به صورت مشابه اگر ما يك تفاوت معنا‌دار در ضمن آزمون فرض نيافتيم. ، ممكن است واقعاً تفاوتي در توزيع‌ها وجود نداشته باشد يا آنكه تفاوتي وجود دارد ولي ما آن را از دست داده‌ايم. در حالت اول همه چيز خوب است ما تفاوتي نيافتيم در حاليكه واقعاً تفاوتي هم وجود ندارد كه بيابيم. در حالت دوم ما مرتكب خطاي نوع دوم شده‌ايم. ما توسط آزمونهایمان تفاوتی در توزیع ها نیافته ایم در حالیکه تفاوتی واقعی برای یافتن وجود داشت.

اگر يك نمره زير سطح معنی داری قرار بگيرد آنگاه ما فرض صفر را پذيرفته كه اين نمره از توزيع شناخته شده آمده است. اگر چه در اينجا اين ريسك وجود دارد كه نمره از توزيع ناشناخته آمده باشد (زيرا بخشي از توزيع ناشناخته زير سطح معنی داری است).

در اينجا مشكلي وجود دارد كه گاهي اوقات در تحليلهاي آماري از آن چشم‌پوشي مي‌شود. ما نمي‌خواهيم آزموني كه ضعيف‌ است انجام دهيم چون احتمال این كه تفاوت واقعی در توزيعها باشد وجود ندارد. ممكن است ما آزمايشي برجسته فقط براي عدم موفقيت دريافتن يك نتيجه معنادار بخاطر قدرت كم آزمون آماريمان ساخته باشيم. خوشبختانه توان بصورت فزآينده‌اي موضوع مهمي در تحليلهاي آماري در بخش اخير قرن بيستم، بويژه بخاطر كارهاي (چاكوب كوهن، 1988) شده است. او ادعا كرده است كه انجام بيشتر تحقيق‌ها بدون ملاحظه توان در مرحله طراحي، موجب آسيب رساندن به پروسه تحقيق شده‌اند. نتيجه كار كوهن آن شد كه اكنون به محققين بيشتري قدرت را مراحل ابتدايي طراحي تحقيقشان مورد ملاحظه قرار مي‌دهند.

مقاله مرتبط: آمار به زبان ساده "مقدمه"

توان يك آزمون

وقتي تحقيق را آغاز مي‌كنيم مي‌خواهيم كه شانس خوبي براي يافتن يك اثر، اگر واقعاً يكي براي يافتن وجود داشته باشد، داشته باشيم. در مثال جستجوي گنج، كمك خوبي خواهد بود اگر بدانيم كه كار را براي يك دستگاه حفاري شروع مي‌كنيم اما هنوز مواردي زياد وجود دارد كه محققين با ابزارهاي آماري آغاز به كار مي‌كنند كه در حد همان تسلط و بيلچه كودكان هستند واضح بگوئيم ما يك آزمون توانمند مي‌خواهيم اما چگونه مي‌توانيم آنرا انجام دهيم .

براي اينكه توان آزمون خود را در مرحله طراحي (مراحل اولیه) بدست بياوريم لازم است كه اندازه اثري را كه روي آن تحقيق ميكنيم بدانيم. ممكن است شما فكر كنيد كه: چگونه من اندازه اثر را پيش از انجام دادن تحقيق بدانم؟ يك منبع اطلاعاتي براي اين كار مطالعات پيشين است. مثلاً اگر ما سرعت تشخيص انواع مختلفي از لغات را آزمايش مي‌كنيم،‌ مي‌دانيم به نوشته‌هايی در مورد اين موضوع نظر افكنده تا ببينيم در تحقيق هاي مرتبط افراد ديگر چه يافته‌اند. مي‌توانيم اين مطالعات را براي بدست آوردن برآوردی از اندازه اثري كه به دنبال آن هستيم به كار ببريم. اگر نوشته‌هاي كمي در اين مورد موجود باشد. ، چون شما روي يك عرصه جديد تحقيق مي‌كنيد. ، آنگاه يك تحقيق اكتشافي (مقدماتي) ممكن است ارزش انجام دادن را پيدا كند تا به شما احساسي از نتايجي كه ممكن است حاصل شود را بدست آوريد.

كوهن (1988) به عنوان راهنماي مفيد براي ارزيابي میزان اختلاف پيش‌بيني شده ، اثرات كوچك (2/0= d)، متوسط (5/0= d) و بزرگ (8/0=d) را از هم جدا كرد. او پيشنهاد كرد علاوه بر تلاش براي بدست آوردن يك اندازه اثر خاص بوسيله برآورد ميانگين‌ها و انحراف استانداردها، مي‌توان توجه نمود كه كجا انتظار يك اثر كوچك، متوسط، يا بزرگ را داريم. او ادعا كرد، براي بخشهای جدید از تحقیق اثرات اغلب كوچك هستند بخشي از آن به اين دليل است كه ابزارهاي اندازه‌گيري‌ پيشرفته‌اي ساخته نشده يا كنترل تجربي كه به انحراف استاندارد نسبتاً بزرگي منجر شود وجود ندارد. بنابراين اگر اعتقاد داشته باشيم كه اثري كه به دنبال آن هستيم كوچك است آنگه بطور معقول مي‌توان اندازه اثر 2/0 را بپذيريم. كوهن پيشنهاد مي‌كند كه اثر متوسط با چشم غيرمسلح قابل رويت است (كوهن 1988 ص 26) به اين معنا كه ما از يك تفاوت آگاهيم همانند تفاوت ميان يك اپراتور دستگاه با تجربه و تازه كار چون خيلي واضح است اما ما مي‌خواهيم جزئيات آن را بيازمائيم. در چنين حالاتي مي‌توانيم اندازه اثر متوسط حدود 5/0 را بپذيريم. در نهايت اثر بزرگي وجود دارند كه به صورت چشمگيري واضحند يا به صورت محسوسی قابل دركند آنگونه كه كوهن (27ص 988) مي‌گويد كه آن را بعنوان مثال خود تفاوت قد بين دختران 13 و 18 ساله به كار مي‌برد. اگر باور داریم كه اثری كه به دنبال آن مي‌گرديم بزرگ است كوهن پيشنهاد مي‌كند كه اندازه اثر 8/0 را انتخاب كنيم.

مقاله مرتبط: 6 دلیل برای فروش شرکت ها

در مثال‌ها، نيازي نيست كه اندازه اثر را برآورد کنیم زيرا ميانگين و انحراف استاندارد جمعيت را اعلام نیاز کرده ایم كه به طور معمول آنها را نداريم. جالب است بدانيد در حيطه اصطلاحات كوهن ما يك پيش‌بيني اثر از متوسط تا بزرگ داريم‌ چون d که بين 5/0 تا 8/0 تغییر می کند.

تأثيري‌گذاري اندازه اثر

ممكن است وسوسه شويد كه ادعا كنيد كه هرگز نمي‌توانيد اندازه اثر را تغيير دهيد زيرا مطمئناً یک اندازه اثر کوچک یک اثر كوچك است و قابل تغییر نیست. اما اگر براي لحظه‌اي توجه كنيم كه منظور ما از اندازه‌ اثر چيست آنگاه مي‌توانيم ببينيم كه چگونه مي‌توان بر روي آن تأثير گذاشت. اندازه اثر بزرگ دلالت بر يك هم‌پوشاني كوچك توزيعها دارد در حاليكه اندازه اثر كوچك دال بر هم‌پوشاني بزرگ ميان توزيعها است. آنچه نياز است كه انجام دهيم تا توان آزمون و اندازه اثر را افزايش دهيم افزايش تفاوت ميانگين‌هاي توزيعها يا كاهش انحراف استاندارد آنها است.

يك راه مهم براي كاهش هم‌پوشاني ميان توزيعها آن است كه تحقيق خودرا به خوبي طراحي كنيد. بسيار مهم است كه توجه كنيم يك طراحي خوب مستلزم چه چیزی است،این مسئله ‌اساساً چيزي است كه باعث كاهش خطاها يا تغيير‌پذيري تصادفي در تحقيق شده و دقت اندازه‌گيري متغيرهاي تحت مطالعه را به حداكثر مي‌‌رساند.

هر چه بيشتر بتوانيد تغييرپذيري تصادفي در تحقيق را (با كنترلهاي صحيح در طراحي و روش کار) كاهش دهيد، اندازه اثر بزرگتر خواهد بود. تصور كنيد ما را در حال آزمودن تشخيص چهره هستيم. ممكن است تحقيق را در يك محيط طبيعي مثل فرودگاه انجام دهيم. یا ممکن است استفاده از صفحه نمایش کامپیوترهایی با زمانبندی دقیق و پاسخهای صفحه کلید در یک محیط آرام و به دور از هر گونه حواس پرتی را ترجیح دهیم تا بتوانیم تغییر پذیری تصادفی در مطالعه را کاهش دهیم.

حساسيت ابزارهاي اندازه‌گيري مي‌تواند به صورت سرنوشت سازي بر توان يك آزمون موثر باشد. اگر درباره شادماني افراد تحقيق مي‌كنيم ممکن است به جای اینکه از خود افراد درباره خوشحال بودن یا نبودن آنها سوال بپرسیم تمایل به استفاده از یک پرسشنامه بسیار پیچیده را داشته باشیم. به صورت مشابه اگر اثر ظريفي همچون سرعت خواندن يك متن متحرك را آزمون مي‌كنيم بايد از يك زمان سنج بسيار دقيق تا يك كرنومتر معمولي استفاده كنيم. علت آن است كه خطاي روشن و خاموش كردن كرنومتر ممكن است يكي دو ثانيه باشد كه مي‌تواند پدیده ای را كه فقط چند هزارم ثانیه طول می کشد در خود محو کند و اثر آن را نشان ندهد . اگر بتوانيم دقت زمان اندازه‌گيري را افزايش دهيم آنگاه احتمال بیشتری برای یافتن اثر (البته اگر وجود داشته باشد) وجود دارد.

مقاله مرتبط: تأثیر ادغام یا تملیک بر شرکت ها

اندازه‌ نمونه

وقتيكه كه نمونه‌اي را به عنوان نماینده ای از جمعیت مورد مطالعه قرار ميدهيم توزيع‌هاي نمونه‌گيري را براي نمايش توزيع‌هاي شناخته شده و ناشناخته به كار مي‌بريم. انحراف استاندارد توزيع نمونه‌گيري یعنی همان خطاي استاندارد ميانگين‌ به همان اندازه كه نمونه بزرگتر مي‌شود كوچكتر مي‌گردد. اين بدان دليل است كه خطاي استاندارد براي مبناي انحراف استاندارد جمعيت و اندازه‌ نمونه، است.

تصویر 9.2- اثر افزایش نمونه میزان همپوشانی توزیع ها

مي‌توان تأثير اندازه نمونه در آمار را با مثال زير نمايش داد. فرض كنيد كه جمعيت شناخته شده‌اي توزيع نرمالي با ميانگين 100 و انحراف استاندارد 15 داشته باشد. فرض مي‌كنيم جمعيت ناشناخته نيز واقعا متفاوت بوده و ميانگين آن 110 است. البته در اين حالت جمعيت ديگر ناشناخته نيست بنابراين ما نيازي به انجام هيچ كار آماري نداريم زيرا آنچه را كه مي‌خواهيم مي‌دانيم اما اين فقط براي نشان دادن بعضی مفاهیم است.

ابتدا بايد موقعيت را وقتي كه نمونه 10 تايي به كار گرفته شده است بيازمائيم. ميانگين توزيع نمونه‌گيري دو جمعيت 100 و 110 است ولي انحراف استاندارد آنها، در واقع خطاي استاندارد برابر خواهد بود با:

انتخاب اندازه نمونه در آزمون آماري

يك تصميم مهم براي يك محقق، تصميم گرفتن درباره تعداد شركت‌كنندگان در تحقيق است اين جايي است كه كار كوهن به صورت خاص سودمند است. همانطور كه در بالا متذكر شديم توان آزمون بستگي به سطح معنی داری ، اندازه اثر و اندازه نمونه دارد. ما مي‌توانيم اين رابطه را برگردانيم و ببينيم كه اندازه نمونه تابعي از سطح معنی داری ، توان آزمون و اندازه اثر است.

محققي درباره صفحه نمايشهاي مختلفي براي صفحه نمايش تجهيزات پزشكي بيمارستانهاي تحقيق مي‌كند. دو نوع از صفحه نمايشها بايد در آزمايشگاه مقايسه شوند تا ببينيم كه استفاده از كداميك منجر به خطاي كمتري در خواندن مي‌شود. محقق مي‌خواهد بداند كه چه تعداد شركت كننده در آزمايش بايد استفاده كند. او تصميم‌گير می گیرد كه از سطح معنی داری 05/0= P براي يك آزمون دو طرفه استفاده كند. توان مورد نياز براي آزمون 8/0 در نظر گرفته شد و فرض بر آن قرار گرفت كه اندازه اثر متوسط بوده بنابراین 5/0 براي اندازه اثر تعيين شد. يك آزمون tبايد روي داده‌هاي خطا انجام شود.

آيا مي‌توانيم محاسباتي همچون بخش پيشين براي يافتن پاسخ انجام دهيم، ؟ جواب هم بله و هم خير است. بله چون می توانیم محاسباتي براي بدست آوردن تعداد شركت‌كنندگان انجام دهيم و نه چون اين مورد مثل مورد بخش پيشين نيست زيرا در آنجا داده‌هاي جمعيت را داشتيم و در اينجا نداريم. وقتيكه دو نمونه را مقايسه مي‌كنيم توزيع tرا بعنوان توزيع مناسب براي تحليل خود به كار مي‌بريم. اما در اينجا يك پيچيدگي وجود دارد زيرا توزيع t كه ما معمولاً براي محاسبه يك آزمون t به كار مي‌بريم براساس نمونه‌هايي است كه از يك توزيع آمده‌اند يعني وقتيكه نمونه‌ها از يك جمعيت باشند.