تحلیل ناپارامتری دو نمونه ای – بخش 1

08 آذر 1400

دقیقه

در فصل سیزدهم مقاله آموزشی آمار به زبان ساده به تحليل ناپارامتری پرداختیم. در این فصل به آموزش تحلیل ناپارامتری دو نمونه ای – بخش 1  در ادامه سری مقالات آموزشی آمار به زبان ساده می پردازیم. فهرست محتوا پنهان 1. آزمون U من ویتنی (برای نمونه های مستقل) 2. معنی داری U 3. توزیع U...

تحلیل ناپارامتری دو نمونه ای – بخش 1

در فصل سیزدهم مقاله آموزشی آمار به زبان ساده به تحليل ناپارامتری پرداختیم. در این فصل به آموزش تحلیل ناپارامتری دو نمونه ای – بخش 1  در ادامه سری مقالات آموزشی آمار به زبان ساده می پردازیم.

در مقایسات دو نمونه ای دو موقعیت متغیری مستقل با در نظر داشت یک متغیر وابسته مقایسه می شوند و در حالت معمولی چنانچه فرضیات مورد نیاز آزمون t در مجموعه ی داده ها وجود داشته باشد این کار با استفاده از این آزمون قابل انجام است. اما زمانیکه نتوان این فرضیات را برقرار کرد و شرایط تنها برای برقراری فرض ترتیبی بودن داده ها برقرار باشد، مجبور به انجام تحلیل های ناپارامتری براساس رتبه های ترتیبی بدست آمده از مجموعه ی داده ها خواهیم بود.

در این فصل معادل های ناپارامتری آزمون های t وابسته و مستقل با  نامهای آزمون U من ویتنی (Mann–Whitney) و آزمون رتبه ای علامت دار ویلکاکسون (Wilcoxon) مورد توجه قرار خواهند گرفت.

آزمون U من ویتنی (برای نمونه های مستقل)

امتیاز های داده شده توسط معلم در ارتباط با دقت شاگردان که فصل قبل مطرح گردید مثالی مناسب در رابطه با حالت دو نمونه ای با نمونه های مستقل است. در این حالت نه می توان فرض کرد که امتیازهای داده شده توسط معلم بر اساس مقیاسی فاصله ای بدست آمده اند و نه هیچ فرضی در مورد امتیاز های بدست آمده از توزیع جمعیت تحت بررسی در نظر داشت. بنابراین چاره ای جز  تحلیل های ناپارامتری براساس رتبه ها وجود ندارد. رتبه های شرکت کنندگان در زیر به نمایش در آمده است.

تحلیل ناپارامتری دو نمونه ای – بخش 1

 

فرضیه ی معلم مبنی بر با دقت  تر  بودن دختران بود. اگر چنین بود انتظار می رفت که رتبه های دختران در مقایسه با رتبه های پسران بزرگتر باشد. در حالت مقابل چنانچه دقت پسران بالاتر باشد می بایست رتبه های بالاتری را کسب کرده باشند. و اگر هیچگونه تفاوتی بین دو گروه در ارتباط با دقت وجود نداشته باشد انتظار می رود که رتبه های دختران و پسران به صورت یکنواخت توزیع شده باشند.

یک راه جهت بررسی اینکه آیا در گروه ها نوعی خوشه بندی در بالا و یا پایین رتبه ها وجود دارد یا نه دریافتن این مسئله است که آیا تعداد زیادی از  افراد یک گروه در مقایسه با گروه دیگر رتبه های بالاتری را دریافت کرده اند. چنانچه جدول زیر را ملاحظه کنیم متوجه می شویم که هیچکدام از پسران بالاتر از مری و سوزان نیستند، یک  نفر بالاتر از هلن، دو نفر بالاتر از لیندا، و پنج نفر بالاتر از کریستین هستند. همین کار را چنانچه در جدول به نمایش درآمده است می توان برای پسراها نیز انجام داد.

تحلیل ناپارامتری دو نمونه ای

در صورتیکه هر پنج دختر اولین پنج رتبه را به خود اختصاص دهند، مجموعشان برابر خواهد  بود با 5×0=0 (زیرا  هیچ پسری بالای آنها وجود ندارد) و پسران بدین صورت امتیاز بندی می شوند 5×5=25 (زیرا هر پنج دختر قبل از آنها هستند). اگر هر پنج پسر در بالا قرار گیرند برعکس آنچه گفته شد بدست خواهد آمد.

با در نظر گرفتن آزمون یک طرفه ی محقق فقط روی حالتی که جمع دختران کوچکتر شود که نشاندهنده ی رتبه ها ی بالای دختران است، تمرکز می شود. اگر دختران نمره ی 0 را بگیرند نتیجه گیری وجود تفاوتی واقعی میان امتیاز های دختران و پسران منطقی به نظر می رسد. اگر دختران نمره ی 25 را دریافت کنند پرواضح است که رتبه ای بالاتر از پسران دریافت نخواهند کرد.

مقاله ی مرتبط:   معامله ادغام شرکت‌های Actavis-Allergan

زمانی که نمره ای میانی بین این دو عدد (12 یا 13) دریافت شود، دو گروه مخلوطی از رتبه ها را خواهند داشت. در مورد مثال ما جمع کل برای دختران 8 است: آیا این مقدار برای این نتیجه گیری که آنها در قالب یک گروه رتبه هایی بالاتر را دریافت کرده اند کافیست؟

در این قسمت برای چنین تحلیی آزمون U من ویتنی (برای دو نمونه مستقل) بسط داده خواهد شد. این روش رتبه های واقعی بدست آمده را با “بهترین رتبه های ممکن” مقایسه می کند، بدین معنی که گروهی به ثمر خواهد رسید که تمامی رتبه های آن در بخش بالایی قرار گیرند.

مشاهده شد که اعداد 8 و 17 همانطور که در جدول بالا بدست آمده بود حاصل شدند و دلیل آن این است که دو روش تحلیل مشابه یکدیگر هستند. آماره U من ویتنی در حقیقت تفاضل میان رتبه های واقعی نمونه و حداکثر رتبه هایی است که می توانند داشته باشند. مقدار کوچک U بیانگر نزدیک بودن گروه به  مقادیر بالایی است. چنین محاسباتی با بکارگیری فرمول ها به صورت زیر خواهد شد:

معنی داری U

برای تصمیم گیری اینکه آیا تفاوت معنی داری بین نمونه ها وجود دارد یا نه نیاز است دو مقدار احتمالی U را زمانی که هیچ تفاوتی بین جمعیتی که نمونه از آن استخراج شده است را بدست آورد. بر اساس چه مقادیر و احتمال هایی از U انتظار می رود که فرض صفر درست باشد؟

تصور کنید فقط دو دختر و دو پسر مورد آزمون قرار گرفته بودند و مقدار U برای دختران 1 و برای پسران 3 بدست آمده باشد. با چه احتمالی می توان به صورت شانسی و نه در حقیقت نتیجه گیری ای در مورد تفاوتی واقعی میان جمعیت ها دست یافت؟ می توان دریافت که به شش طریق ممکن دو دختر و دو پسر می توانند به  ترتیب کنار هم قرار بگیرند:

ناپارامتری

زمانی که فرض صفر درست باشد انتظار می رود که هر کدام از این حالات با احتمالی برابر با یک اتفاق بیفتند. از آنجاییکه شش حالت  مختلف وجود دارد هر کدام از آنها با احتمال 1/6 و یا 0.167 رخ می دهند. اکنون می توان احتمال تصادفی بدست آمدن مقدار U را محاسبه کرد. U تنها به یک طریقه می تواند مقادیر 0 ، 1، 3 و یا 4 را و هر کدام با احتمال 0.167 کسب کند اما انتصاب عدد 2 به U به دو  روش و بنابراین با احتمال 0.33 امکانپذیر است. آزمون فرض به گونه ای بیان می شود که یا از یک مقدار خاص بزرگتر و یا کوچکتر است.

در مورد این مثال امتیاز دختران یک است. بنابراین احتمال تصادفی کوچکتر از یک برابر است با احتمال دریافت 1 (با احتمال 0.167) به علاوه احتمال دریافت  0 (با احتمال 0.167) که در نهایت برابر با 0.33 می شود. چنانچه سطح معنی داری p=0.05 انتخاب شود می توان اظهار داشت که احتمال کسب مقدار یک یا کمتر خیلی بیشتر (0.33) بوده و در نتیجه در سطح p=0.05 معنی داری رخ نمی دهد.

مقاله ی مرتبط:   175 راه برای انجام کار بیشتر در زمان کمتر "فصل دوم"

با مراجعه به مثال ذکر شده با 5 پسر و 5 دختر، محاسبات مشابهی را می توان انجام داد. اما اینکه بخواهیم 252 حالت ممکن از ترتیب های مختلف نمونه ها را در نظر بگیریم کاری خسته کننده است اما منطق مشابه همان است. زمانی که فرض صفر درست باشد هر کدام از رخداد های احتمالی ممکن برابر خواهند بود و قادر خواهیم بود احتمال نائل شدن به یک مقدار خاص را محاسبه کنیم.

برای دختران تنها به یک طریقه ممکن U  می تواند 0 باشد و در نتیجه این احتمال برابر 1/252  و یا 0.004 خواهد بود و همچنین تنها یک حالت وجود دارد که U برابر 1 باشد (با احتمال 0.004)، دو حالت برای U برای 2 (ا احتمال 0.008) و به همین ترتیب، که در جدول هم مشاهده می شود.

پارامتری

به دو دلیل محاسبات بعد از 5 متوقف شده است. اول اینکه انجام  این کار سخت است و دیگری اگر به آخرین ستون نگاه کنیم در می یابیم مقادیری از U که به صورت تصادفی رخ می دهند احتمالی کمتر از 0.05 را  به خود اختصاص می دهند (سطح معنی داری مورد نظر). با وجود پنج دختر و پنج پسر با مقدار U ی 4 یا کمتر همچنانکه احتمال آن کمتر از سطح معنی داری است می تواند معنی دار (در سطح p=0.05) معنی دار تلقی شود.

خوشبختانه نیازی نیست کلیه ی احتمال های جدول بدست آمده را محاسبه کرد و مقادیر بحرانی U در جدول هایی به صورت آماده وجود دارند و تنها نیاز است سطح احتمال مورد نظر را انتخاب کرد. (جدول A.5 در ضمیمه را ببینید). با مراجعه به جدول مشاهده خواهید کرد که برای مقادیر کوچک n1 و n2 مقدار به جای مقدار بحرانی خط تیره گذاشته شده است.

زیرا همانگونه که برای حالتی با دو دختر و دو پسر امکان اینکه با این نمونه ها با حجم کوچک مقداری با احتمال کوچکتر از سطح معنی داری p = 0.05 را بدست آوریم وجود ندارد.

همچنین چنانچه به جدول نگاهی داشته باشیم متوجه می شویم که باید تصمیم گیری کنیم می خواهیم آزمون یک طرفه و یا دو طرفه انجام دهیم. در مورد مثال ما آزمونی یک طرفه بود: زیرا ما مقدار U ی (U1) دختران را در نظر گرفتیم و علاقه مند مقدار مشابه آن در پسران نبودیم.

چنانچه آزمونی دو طرفه انتخاب شود مقادیر U1 و  U2 به سادگی برای مقایسه با جدول مقادیر  انتخاب می شوند. زمانی که به جستجوی مقادیر در جدول پرداخته می شود باید در خاطر داشت که با دلیلی مشابه بالا مقادیری باعث معنی داری می شوند که کوچکتر یا مساوی مقدار محاسبه شده باشند.

اکنون می توان جهت مقایسه مقادیر U ی محاسبه شده برای دختران با مقدار جدول (جدول A.5) اقدام کرد. در رابطه با آزمون یک طرفه با n1 = 5 و n2 = 5 ، مقدار بحرانی U در سطح معنی داری p = 0.05 برابر با 4 است. اگر مقدار محاسبه شده برای دختران بزرگتر باشد ( که برابر با 8 است) نمی توان در این سطح معنی داری فرض صفر را رد کرد؛ و تفاوت معنی داری میان امتیاز با دقت بودن دختران و پسران وجود ندارد.

توزیع U

هنگامی که فرض صفر درست باشد، هر گونه تغییری در رتبه های دو نمونه به دلیل عوامل تصادفی ایجاد شده است. چنانچه بخواهیم تصمیمی در مورد مقدار آماره ی محاسبه شده بگیریم نیاز است به طور دقیق در مورد چگونگی تفاوت هایی که ممکن است به صورت تصادفی ایجاد شده باشند اطلاعاتی داشته باشیم، بنابراین نیاز است توزیع U را زمانی که فرض صفر درست باشد را بدانیم. چنانچه در قسمت های قبل مشاهده کردیم به ازاء هر نمونه یک مقدار U محاسبه می شود. دامنه ی تغییرات U از 0 است تا n1n2، اما زمانیکه فرض صفر درست

مقاله ی مرتبط:   ۱۷۵ راه برای انجام کار بیشتر در زمان کمتر “فصل چهارم”

در استفاده از مقدار U باید تا حدودی دقت داشته باشیم. چنانچه بیش از حد داده های گره خورده وجود داشته باشد ممکن نتایج نادرستی حاصل شود. اگر تعداد زیادی از داده های گره خورده وجود داشته باشد در کاربرد متغیر وابسته چنین سؤالی قابل تعمق است: آیا این مقدار اندازه گیری شده برای بررسی تفاوت های بین آزمودنی ها و رتبه داده به آنها کفایت می کند؟

مراحل محاسبه ی آماره U من ویتنی

1 به تمامی نمرات از کوچکترین تا بزرگترین رتبه بدهید.

3 مقدار کوچکتر را با مقدار بحرانی جدول مقایسه کنید (جدول A.5 در ضمیمه). برای معنی دار شدن مقدار محاسبه شده می بایست کوچکتر و یا مساوی مقدار جدول باشد. (در آزمون یک طرفه چنانچه نمونه انتخابي بالاترين رتبه ها را به خود اختصاص دهند كوچكترين دو مقدار U توليد نشده و عدم معني داري را منتج مي شود).

مثال كاربردی

دو باشگاه اجتماعي هيلتاپ و والي جهت جذب نيرو و كرايه ي مربي تصميم دارند از آنها بخواهند به تماشاي تئاترهاي منتصب به شكسپير كه در نزديكي شهر برگزار مي گردد بپردازند. يكي از دبيران باشگاه به منظور آگاهي از ميزان لذت بردن اعضاء از بازي از آنها خواسته شد بر حسب ميزان رضايتمنديشان از بازي امتيازي در فاصله ي 0 تا 100 بدهند. اعضاي باشگاه اجتماعي والي تمايل دارند خودشان را به عنوان افرادي با فرهنگ بالا جلوه دهند، از اينرو دبير باشگاه پيش بيني مي كند كه امتياز تعلق گرفته به ميزان لذت آنها بالاتر از اعضاي گروه هيلتاپ باشد. آيا با وجود داده هاي زير پيش بيني دبير باشگاه پابرجاست؟

آمار

فرضيه ي خاصي در رابطه با داده ها و يا توزيع جمعيت تحت بررسي وجود ندارد (جز اينكه ترتيبي هستند)، بنابراين مي بايست از آزمون U من ویتنی استفاده شود.

ابتدا به امتياز ها با احتساب دو گروه رتبه داده مي شود و نتيجه به صورت زير حاصل مي شود:

آمار به زبان ساده

آزمون يك طرفه است، بنابراين مقدار گروه والي آنU  ي است كه در نظر گرفته مي شود. از آنجاييكه اين مقدار كوچكتر است به نظر مي رسد كه جهت در نظر گرفته شده (مترجم: انتخاب گروه والی) درست باشد. براي تصميم گيري در مورد معني داري با داشتن n1  و  n2  تصميم گيري مي شود. با توجه به جدول A.5 در آزمون يكطرفه، U = 9, n1 = 7, n2 = 9, p = 0.01 . با توجه به محاسبات صورت گرفته مقدار U  ي بدست برابر با 7 بوده كه از مقدار جدول كوچكتر مي باشد و مي توان نتيجه گرفت كه اعضاي باشگاه والي در مقايسه با اعضاي باشگاه هيلتاپ، به طور معني داري امتيازهاي بالاتري به ميزان لذتشان از بازي داده اند.

مترجمین: دکتر هدی کامرانی فر – حسن اسکندری نیا

اشتراک گذاری در شبکه های اجتماعی
@

لطفا شکبیا باشید...