آمار به زبان ساده – آزمون فرضیه با یک نمونه

02 شهریور 1400

دقیقه

بعد از مطالعه فصل مقدمه ای بر آزمون فرضیه کتاب آمار به زبان ساده در فصل 6 از کتاب آمار به زبان ساده به بررسی آزمون فرضیه با یک نمونه میپردازیم.

آمار به زبان ساده- آزمون فرضیه با یک نمونه

فصل 6: آزمون فرضیه با یک نمونه

بعد از مطالعه فصل مقدمه ای بر آزمون فرضیه کتاب آمار به زبان ساده این فصل را با بررسی یک مثال شروع می‌کنیم.

یک مثال

نشت گاز سایدامین از یک کارگاه تولید مواد شیمیایی در شهر نیوتن کاستل وابرهای ناشی از آن برای چند روز مردم این شهر را، پیش از آنکه بطور کامل در جو پراکنده شود، نگران نمود. شکایتی در میان مردم از درد گلو در این مورد وجود داشت اما شرکت شیمیایی مردم را مطمئن کرد که گاز سایدامین روی بدن انسان هیچ‌گونه اثر منفی ندارد. بهرحال یک دانشمند که روی پروژه سایدامین کار می‌کرد به سراغ سوابقی رفت که می‌گفتند این گاز می‌تواند روی زنان باردار و بچه‌هایی که در شکم آنان هستند تأثیر نامطلوب بگذارد. شرکت شیمیایی ادعای این دانشمند را غیرمعقول خوانده و رد کرد و گفت این دانشمند نمی‌تواند مشخص کند که چه مشکلاتی برای این اشخاص می‌تواند بروز کند. در شرکت شیمیایی اطمینان همگانی وجود نداشت و در نواحی که مورد اصابت واقع شده بودند خصوصا از ناحیه والدین بچه‌های کوچک نگرانیهایی موجود بود. یک دکتر در بیمارستان بزرگ زنان و زایمان، بر روی بچه‌هایی که 9 ماه پس از واقعه ابرهای گازی که شهر را درنوردید، بدنیا آمده بودند متمرکز شد. او متوجه شد که بچه‌ها در آزمایشهای معمول سالم بنظر می‌آیند اما شک کرد که گاز سایدامین وزن نوزادان را هنگام تولد کاهش میدهد. زیرا بسیاری از کودکان متولد شده کوچک بودند. این خانم دکتر نگران اثرات درازمدت بود و می‌خواست آزمایش کند که آیا بچه‌های سایدامین در هنگام تولد کوچکتر هستند یا خیر؟ بر این اساس دکتر پیش‌بینی یک دمی انجام داد: توزیع وزن زمان تولد کودکان تحت تأثیر سایدامین متفاوت از توزیع کودکان معمولی است. این توزیع روی انتهای پائینی توزیع کودکان معمولی قرار می‌گیرد.

برای آزمون این فرضیه، نیاز است جزئیات وزن زمان تولد دو جامعه را داشته باشیم. مقایسه این دو توزیع به ما خواهد گفت آیا اختلافی بین این دو وجود دارد، خصوصاً آیا میانگین وزن زمان تولد کودکان تحت تأثیر گاز کمتر از کودکان معمولی است؟ اما مشکل جمع‌آوری جزئیات دو جامعه است.

ممکن است در این زمینه خوش شانس باشیم، چون سوابق پزشکی با جزئیات زیاد موجود هستند و اجازه دهید فرض کنیم که آنها جزئیات وزن زمان تولد را دارند. ما از سوابق  بچه‌هایی که در این منطقه به دنیا آمده‌اند درمی‌یابیم که میانگین وزن زمان تولد 2.3 کیلوگرم و انحراف استاندارد 9.0 کیلوگرم است. این جزئیات درباره کودکانی است که تحت‌تأثیر گاز سایدامین قرار نگرفته‌اند.

مشکل جمع‌آوری اطلاعات درباره کودکانی است که تحت‌تأثیر گاز سایدامین قرار گرفته‌اند. اساساً آنچه ما می‌خواهیم بدانیم آن است که جامعه کودکان معمولی چگونه تحت‌تأثیر سایدامین قرار خواهند گرفت؛ آیا بر روی آنها تأثیری خواهد گذاشت همانگونه که دکترها پیش‌بینی کرده‌اند که اثر سایدامین کاهش وزن زمان تولد همه به مقدار مشخصی است.

ما هرگز نمی‌توانیم جزئیات این جامعه را بدست آوریم، تمام آنچه داریم کودکانی از شهر نیوتن کاستل است که در زمان نشت گاز در شکم مادر خود بوده‌اند. این تنها یک نمونه از جامعه دوم است. نه فقط آن بلکه نمونه ما لزوماً نه نمایانگر جامعه و نه تصادفی است. نمی‌توان نمونه را آزادانه از جامعه تحت تأثیر گاز برگزید. نمونه‌های ما می‌تواند به همان اندازه سایدامین از فاکتورهای دیگر نیز تأثیر بگیرند یا به جای گاز از چیزهای دیگر مثل تولد زودروس که موجب کاهش وزن است تأثیر گرفته باشند.

ما تصمیم می‌گیریم یکصد کودک را انتخاب کرده و توازنی میان آنها از جهت تولد در خانه یا در بیمارستان و محدوده سن جنین در هنگام نشت گاز  و مانند آنها، برقرار کنیم تا تلاش کرده باشیم که نمونه برگزیده بصورت سیستماتیک با فاکتورهایی همچون عملیات بیمارستانی، سن جنین و غیره تحت تأثیر واقع نشده باشد. ممکن است ما قادر نباشیم که همه تفاوتهای سیستماتیک که اثرات گاز سایدامین را روی نمونه و کودکان معمولی جدا می‌کند به حساب آوریم. اما می‌توانیم تمام تلاش خود را برای کنترل متغیرهای ابهام زای کلیدی انجام دهیم. (فصل 7 را برای توضیح بیشتر درباره ابهام زایی  ببینید). اگر تفاوتی میان کودکان سایدامین و کودکان غیر آلوده یافتیم، ارزش خواهد داشت که برای اطمینان از اینکه آیا واقعاً تحت تأثیر گاز سایدامین بوده یا دلایل دیگر، تحقیقات بیشتری انجام دهیم. اگر تفاوتی یافت نشاید می‌توانیم تصمیم بگیریم که نیاز به تحقیقات بیشتری نیست.

ما وزن زمان تولد نمونه‌هایی از بچه‌های سایدامین را بدست آورده و میانگین نمونه را محاسبه می‌کنیم. عدد 0.3 کیلوگرم بدست می‌آید. آیا می‌توانیم این میانگین را با میانگین جامعه کودکان آلوده نشده معمولی مقایسه کنیم؟ پاسخ منفی است، زیرا دو چیز مشابه را مقایسه نمی‌کنیم و این احتمال اریبی را افزایش میدهد. برای تشریح این موضوع اجازه دهید چند لحظه جامعه معمولی را مورد ملاحظه قرار دهیم. همه کودکان در زمان تولد هم وزن نیستند، بعضی از آنها نسبت به سایرین بنا به پراکندگی نرمال وزن زمان تولد، سبکتر هستند. حتی احتمال این مسئله نیز وجود دارد که اگر نمونه‌ای از بچه‌های معمولی انتخاب کنید ممکن است وزن میانگین آنها کمتر از وزن میانگین جامعه باشد. که به صورت شانسی ممکن است که گروهی از کودکان را که نسبتاً سبکترند علیرغم این واقعیت که آنها از جامعه ای می‌آیند که میانگین وزن زمان تولد آنها بیشتر است انتخاب کرده باشیم. ممکن است ما بچه‌های کوچکتر را انتخاب کرده باشیم (مطمئنم به همان صورت می‌توانید تصور کنید ممکن است نمونه‌ای با میانگین وزن زمان تولد بیش از میانگین جامعه برگزینیم). حتی اگر نمونه انتخاب شده ما از کودکان سایدامین، میانگینی پائینتر از کودکان معمولی نشان دهد، این را نمی‌توان به عنوان اثر گاز سایدامین بر وزن زمان تولد آنها تلقی نمود. این ممکن است به دلیل تفاوت جامعه نبوده و به آسانی بدلیل طبیعت نمونه‌گیری اتفاق افتاده باشد.

خوب اگر ما نتوانیم میانگین نمونه را با میانگین جامعه مقایسه کنیم پس چه می‌توانیم انجام دهیم؟ به یاد بیاورید که ما می‌توانیم یک نمره را با داشتن جامعه ای از نمرات مقایسه کنیم بنابراین نیازمندیم که میانگین نمونه را با جامعه ای از میانگین نمونه‌ها مقایسه نمائیم. اگر ما همه نمونه‌های ممکن 100تایی را از کودکان معمولی برگزیده و میانگین نمونه‌ها را بدست آوریم آنگاه می‌توانیم توزیعی از میانگین نمونه‌ها ایجاد کنیم. بدین روش ما یک توزیع شناخته شده از میانگین نمونه‌های صدتایی از کودکان معمولی و یک توزیع ناشناخته یعنی توزیع میانگین نمونه صدتایی از کودکان جامعه آلوده، ایجاد کرده‌ایم. حالا می‌توانیم میانگین نمونه‌های دو جامعه را با یکدیگر مقایسه کنیم. اگر متفاوت باشند و میانگین توزیع کودکان آلوده کوچکتر باشد، فرضیه دکترها را تائید خواهیم کرد. متاسفانه ما هنوز جزئیات این  جامعه‌ها را نداریم و تنها یک مقدار از جامعه ناشناخته یعنی میانگین نمونه صدتایی کودکان آلوده را در دست داریم.

اما آیا جزئیات توزیع میانگین‌ نمونه‌های 100تایی از کودکان معمولی را داریم، در اینجا پاسخ بلی است. خوشبختانه همانگونه که در فصل گذشته دیدیم، نیازی نیست که بیرون رفته و از همه گروه‌های ممکن 100تایی از کودکان معمولی نمونه بگیریم زیرا ما میدانیم در توزیعهای نمونه‌گیری با اندازه بزرگتر از 30، توزیع میانگین‌ نمونه‌ها تقریباً قطعی یک توزیع نرمال است.

 

اکنون یک چهارچوب منطقی برای آزمون فرضیه مشابه با آنچه در فصل 4 داشتیم ایجاد کرده‌ایم. ما یک نمره از یک توزیع ناشناخته در این مورد کودکان آلوده با میانگین 3 و یک توزیع شناخته شده یعنی توزیع نمونه‌گیری از نمونه‌های کودکان معمولی با همان اندازه داریم. این توزیع به صورت نرمال با میانگین 2.3 و انحراف استاندارد 09.0 می‌باشد. تمام آنچه  نیاز است انجام دهیم عبارت است از برگزیدن یک سطح معنی داری برای فرضیه دکترها، یافتن نمره z ، جستجو در جدول و یافتن احتمال و گرفتن تصمیم بر اینکه آیا نمونه آلوده از توزیعی مشابه نمونه کودکان معمولی بوده یا پائین‌تر از آن است.

ما در خواهیم یافت که احتمال نمونه‌ای از کودکان معمولی صدتایی با میانگین 3 را از طریق محاسبه مقدار z چقدر محتمل است .به یاد بیاورید که نمره z ، یک مقدار منهای میانگین جامعه تقسیم بر انحراف استاندارد جامعه است. در اینجا میانگین

 

چون توزیع نمونه‌گیری ما یک توزیع استاندارد است می‌توانیم احتمال نمره Z آن را با نگاه کردن در جدول توزیع نرمال استاندارد بدست بیاوریم. به یاد داشته باشید که علامت منفی به آسانی به ما گوشزد می‌کند که نمره ما پائین‌تر از میانگین توزیع است. از جدول A.1 در ضمیمه a، نمره z 22.2  احتمالی برابر با 0132.0 به ما می دهد. بنابراین احتمال بدست آمدن میانگین نمونه‌ای به کوچکی یا کوچکتر از 0.3 کیلوگرم از یک نمونه صدتایی کودکان معمولی فقط 0132.0 است. این به خوبی زیر 5 درصد از توزیع نمونه‌گیری کودکان معمولی و به خوبی زیر سطح معنی داریP=0.05 می‌باشد. می‌توانیم نتیجه بگیریم که میانگین نمونه 0.3 کیلوگرم آنقدر در کودکان معمولی نایاب است که میانگین 0.3 کیلوگرمی نمونه کودکان آلوده ما دلالت بر آن دارد که این توزیع همان توزیع کودکان معمولی نبوده و فرضیه صفر را رد می‌کنیم، که حاصل آن خواهد بود که کودکان آلوده به گاز سایدامین در هنگام تولد وزن کمتری نسبت به معمولی دارند. این مسئله به صورت گرافیکی در تصویر 6.1 نشان داده شده است.

                     

مقاله های مرتبط:   تملیک شرکت مانسمان توسط شرکت ودافون

تصویر 601    آزمون فرضیه با نمونه ای از کودکان آلوده به گاز سایدامین

خلاصه آنچه گذشت

وقتیکه نمونه‌ای از یک جامعه ناشناخته داریم نمی‌توانیم آن را با یک جامعه شناخته شده مقایسه کنیم. باید میانگین نمونه،

با استفاده از این اطلاعات در مثالی که فرضیه را آزمودیم نشان داد که جایگاه توزیع ناشناخته از توزیع شناخته شده پایین تر است. از آنجا که توزیع شناخته شده یک توزیع نرمال است ما از نمره z برای یافتن احتمال اینکه میانگین توزیع شناخته شده به کوچکی و یا کوچکتر از میانگین توزیع ناشناخته باشد استفاده می کنیم. چون احتمال بدست آمده کوچکتر از سطح معنی داری است، فرضیه صفر را رد کرده و نتیجه می‌گیریم که جایگاه توزیع ناشناخته کوچکتر از توزیع شناخته شده است: یعنی بچه‌های آلوده به گاز سایدامین در هنگام تولد وزن کمتری از بچه‌های معمولی دارند.

 

وقتیکه انحراف استاندارد جامعه را در دست نداریم.

متوسط خرید در یک سوپر مارکت 25 قلم است. شرکت (صاحب فروشگاه) می‌خواهد این رقم را افزایش داده و یک سلسله فعالیت تبلیغاتی برای تشویق خریداران به خرید بیشتر محصولات فروشگاه به راه اندازد. یک هفته بعد از تبلیغات 50 خریدار مورد آزمایش قرار گرفتند تا روشن شود تعداد خریدها افزایش یافته است یا خیر. از آنها تعداد خریدهای زیر ثبت شده است.

میانگین تعداد خرید این نمونه 30 قلم و انحراف استاندارد نمونه 43.8 است.

آیا فعالیت‌های تبلیغاتی تأثیری داشته است؟ همانگونه که در بالا می‌بینید ما نمی‌توانیم میانگین نمونه پس از تبلیغات خریداران را (30 قلم) با میانگین جامعه پیش از تبلیغات خریداران (25قلم) مقایسه کنیم زیرا یکی نمونه و دیگری یک جامعه است. برای مقایسه میانگین نمونه با توزیع میانگین‌ نمونه‌ها، می‌بایستی توزیع نمونه‌گیری میانگین نمونه‌ها به همان سایز 50 تایی از خریداران پیش از تبلیغات را محاسبه کنیم. این توزیع میانگین  (زیرا  به همان اندازه میانگین

متأسفانه، در اینجا گیر می‌افتیم، زیرا در این حالت  را یعنی انحراف استاندارد جامعه خریداران پیش از تبلیغات را نداریم. برای ادامه باید  را تخمین بزنیم.  فرض می‌کنیم که تأثیر فعالیتهای تبلیغاتی، بالا بردن رتبه کل توزیع فروشهاست: یعنی پس از فعالیتهای تبلیغی میانگین جامعه بالاتر بوده (افراد اقلام بیشتری خریداری می‌کنند) اما انحراف استاندارد به همان شکل باقی می‌ماند (پراکندگی تعداد خریدها به همان شکل قبل است) تنها انحراف استانداردی که ما داریم، انحراف استاندارد نمونه پس از تبلیغات s است. انحراف‌ استاندارد نمونه ،مقداری پایدار بوده و به خوبی مقدار موجود در جامعه در جامعه را برآورد می کند بنابراین می‌توانیم این را برای برآورد کردن انحراف استاندارد جامعه پس از تبلیغات استفاده کنیم. از آنجائیکه فرض می‌کنیم انحراف استاندارد جامعه پس از تبیلغات، با پیش از تبلیغات یکسان است، می‌توانیم انحراف استاندارد نمونه خود sرا بعنوان یک تخمین از انحراف استاندارد جامعه پیش از تبلیغات به کار ببریم (چون ما پیش‌بینی کردیم که اثر تبلیغات رتبه توزیع را بالاتر برده ولی به هرحال شکل آن را تغییر نمی‌دهد و لذا انحراف استاندارد به همان اندازه باقی می‌ماند). برای به کار بردن انحراف استاندارد نمونه بعنوان برآوردی از پارامتر جامعه، باید تقبل کنیم که هیچگونه اریبی ای در نمونه ما رخ نداده است مثلاً فقط از خریداران پولدار بوده و یا نمی‌تواند برآورد خوبی باشد. بنابراین فرض می‌کنیم نمونه ما بصورت تصادفی از جامعه پس از تبلیغات انتخاب شده است. اگر این مفروضات درست باشد آنگاه انحراف استاندارد نمونه یک برآورد قابل قبولی از مقدار جامعه پیش از تبیلغات خواهد بود.

برای مشخص نمودن اینکه ما انحراف استاندارد جامعه یعنی  را نداشته و به جای آن از S برای برآورد استفاده کرده،  به جای استفاده از آماره Z، آماره جدید را t می‌نامیم.

همانگونه که در فصل قبل دیدیم انحراف استاندارد نمونه فرمول زیر را دارد:

با جایگزین کردن مقدار S در فرمول t، فرمول جدید زیر را برای t خواهیم داشت:

 

توجه کنید که t بوسیله درجه آزادی نمونه تحت تأثیر قرار گرفته است(n-1). این بخاطر آن است که t همان Z نیست، بلکه برآوردی از اوست. وقتیکه درجه آزادی کوچک باشد توزیع t مشابه توزیع نرمال ولی صاف‌تر و پراکنده‌تر است. همانطور که درجه آزادی بزرگتری شود توزیع t به سرعت به توزیع نرمال نزدیک شده و زمانیکه درجه آزادی برابر بی‌نهایت باشد، مشابه توزیع نرمال خواهد بود. تصویر 602 سه توزیع t با 1 و 10 و بی‌نهایت درجه آزادی را نشان می‌‌دهد. حتی در 10 درجه آزادی توزیع t بسیار شبیه توزیع نرمال است و در 30 درجه آزادی و بالاتر از آن تفاوتها آنقدر کوچک هستند که قابل نادیده‌ گرفتن می‌باشند.

ما همیشه در جدول توزیع نرمال استاندارد به دنبال نمره Z می‌گردیم. با t این کار را نمی‌توان انجام داد چون t یک توزیع نرمال نیست. ولی بهرحال همانند جدول توزیع نرمال استاندارد، مقادیر توزیع t نیز استخراج شده است. مسلم است که آنها برای مقادیر متفاوت توزیع t مطابق با درجه‌های مختلف آزادی بدست آمده‌اند. می‌توانیم برای مقدار t محاسبه شده خودمان در جدول به دنبال توزیع مناسب گشته و احتمال اینکه این مقدار از یک توزیع شناخته شده باشد را بیابیم.

 

تصویر 602  مثالهایی از توزیع t

می‌توان این مقدار را با سطح معنی داری مقایسه کرد و تصمیم گرفت که فرضیه صفر را پذیرفته یا آنرا رد می‌کنیم. بنابراین می‌توانیم درگیر آزمون فرضیه ای شویم که نمونه ای داشته، حتی زمانیکه انحراف استاندارد جامعه شناخته شده را نمی‌‌دانیم.

برای انجام آزمون t باید سه فرض را بپذیریم:

  • توزیع شناخته شده به صورت نرمال توزیع شده است. این مهم است زیرا (همانند نمره Z) نیاز داریم که توزیع نمونه‌گیری ما به صورت نرمال باشد. اگر چنین نباشد توزیع t در جدول نمی‌تواند ارقام مناسب را برای تصمیم‌گیری در مورد معنادار بودن مقدار t که محاسبه کرده‌ایم به ما بدهد. اما بهرحال اغلب تصریح می‌شود که آزمون t نیرومند است، این اصطلاح اهالی آمار است برای اینکه بگویند حتی اگر توزیع نمونه‌گیری پایه، توزیع نرمال نباشد، آزمون t ممکن است همچنان ارقام قابل قبولی برای مقایسه مهیا کند. توزیع جامعه پایه هرچه می‌خواهد باشد ، به طور قطع وقتیکه اندازه نمونه 30 یا بزرگتر باشد، توزیع نمونه‌گیری بسیار نزدیک به نرمال است.
  • نمونه به صورت تصادفی از جامعه (ناشناخته) گرفته شده است.زیرا می‌خواهیم انحراف استاندارد نمونه ، برآوردی بدون اریبی از انحراف استاندارد جامعه و بنابراین برآوردی مناسب برای به کار بردن باشد، در غیر اینصورت بر محاسبه t تأثیر خواهد گذاشت.
  • انحراف استاندارد جامعه ناشناخته ، مشابه همان انحراف استاندارد جامعه شناخته شده است. تنها در صورت پذیرفتن این فرض است که می توانیم انحراف استاندارد نمونه را به عنوان برآوردی از انحراف استاندارد جامعه شناخته شده به کاربریم .

به مثال خود بازگشته و می‌گوئیم تا زمانیکه دلیلی بر اینکه «نمونه 50 تایی خریداران ما به طور اریب انتخاب شده باشند» وجود ندارد فرض‌های بالا برای مقرر شدن در اینجا معقول است . اکنون می‌توان t را برای یافتن احتمال وجود یک نمونه پیش از تبلیغات با میانگینی به بزرگی 30 ، محاسبه کنیم.

 

 

 

 

طبعاً درجه آزادی را نیز باید محاسبه کنیم.

 

  49= 1- 50 = 1 – n

اگر به جدول مقادیر t در ضمیمه A.2 نگاه کنیم، متوجه خواهیم شد که برخلاف جدول نرمال استاندارد، این جدول همه مقادیر توزیع را ندارد چون در آن صورت می‌بایست برای دادن مقادیر هر توزیع متفاوت t، جدول پشت جدول می‌ساختیم. آنچه در این جدول موجود است مقادیر کلیدی برای هر توزیع بوده و به شکلی که مقادیر کلیدی ، مقادیر t در سطح معنی دار بودنی است که برگزیده‌ایم یعنی کدام مقدار t به طور دقیق 5 درصد از احتمال و کدام مقدار 1 درصد از احتمال کل توزیع t را جدا می کند.

ما یک آزمون یک دمی داشتیم (که پیش‌بینی کردیم برنامه‌های تبلیغاتی در فروش بیشتر موثر بوده است). با استفاده از سطح معنادار بودن P=0.05 ، نگاهی به پائین ستون P=0.05 انداخته و به دنبال ردیف درجه آزادی 49 درجه می‌گردیم، اما می‌بینیم که مقدار t برای آن موجود نیست. رقم 684.1را برای درجه آزادی 40 و 671.1 برای 60 درجه آزادی در آن‌جا وجود دارد. مجدداً تکرار می‌کنیم دلیلش این است که اگر می خواستیم برای همه اعداد مقدار ذکر کنیم این ستونها تا ابد باید ادامه می‌یافت.

می ببینیم که بین این دو مقدار تفاوت زیادی وجود ندارد (013.0) بنابراین به طور اجمالی می‌دانیم که مقدار 49 درجه آزادی جایی بین آن دو است (671.1 و 684.1). با روشی که تناسب خطی نامیده می‌شود و ساده‌تر از آن چیزی که بنظر می‌آید است آن را محاسبه می کنیم.  بین 40 و 60 یک فاصله 20تایی و بین 684.1 و 671.1 یک فاصله 013.0 است. بنابرای برای هر درجه آزادی بین 40 تا 60، در جدول مقدارئ 20 / 0.013  تفاوت وجود دارد که برابر 00065.0 می‌شود برای 9 درجه آزادی فاصله برابر 00585.0 = 00065.0 × 9 خواهد شد. از این رو برای 49 درجه آزادی، در جدول مقدار t برابر 00585.0 – 684.1 بوده که حاصل آن 67815.1 است. ( اگر مایل به تناسب گرفتن نیستید از میان دو عدد جدول، عدد بزرگتر را بگنجانید).

از آنجائیکه مقدار t ما که برابر 67815.1 است با 49 درجه آزادی دقیقاً 5 درصد از احتمال زیر نمودار t را جدا می کند، و اگر مقدار t بزرگتر شود، ناحیه کوچکتری از انتهای توزیع یا دم را قطع خواهد نمود، احتمال بدست آوردن مقدار t معادل 19.4 از توزیع شناخته شده کمتر از 5 درصد است بنابراین می‌توانیم فرضیه صفر را رد کرده و برای متفاوت بودن دو توزیع استدلال کنیم.

مقاله های مرتبط:   تاریخ‌ها و توابع تاریخ

ساد‌ه‌تر از آن می‌توانیم نتیجه بگیریم  از آنجائیکه مقدار محاسبه شده ما برای 19.4 با 49 درجه آزادی بزرگتر از مقدار 67815.1 است ، و برای یک آزمون یک طرفه در سطح معنی داری P=0.05  افزایش قابل توجهی در اقلام خرید پس از برنامه‌ تبلیغاتی وجود دارد. توجه کنید حتی در سطح معنی داری محافظه‌کارانه‌تر P=0.01 نیز این مقدار قابل توجه است. معمولاً یافته‌ها در سطح معنی داری پائین‌تر را دلیل بر غیر محتمل بودن ایجاد این اثر بصورت شانسی ذکر می‌کنند. (می‌توانید با استفاده از تناسب مقدار جدول t برای 49درجه آزادی در سطح معنی داری P=0.01 را بدست آورید. قطعاً مقدار بدست آمده شما t=2.40815 خواهد بود).

فواصل اطمینان

آزمون t، آزمونی برای معنادار بودن است و ما براساس اطلاعات ساده‌ای که داریم شواهد را برای بررسی یک اختلاف معنادار آماری بین جوامع جستجو می‌کنیم. روش دیگر به کار بردن اطلاعات نمونه برای برآورد کردن پارامترهای جامعه است. اکنون ممکن است بگوئید که قبلاً این کار را با استفاده از مقدار میانگین نمونه برای برآورد مقدار جامعه انجام داده ایم. این صحیح است اما می‌توانیم با بدست آوردن فاصله اطمینان برای میانگین کمی پیشرفته‌ تر عمل کنیم. افزون بر انتخاب یک مقدار برای میانگین جامعه، می‌توانیم محدوده‌ای از مقادیر را که مطمئن هستیم آن مقدار در آن  وجود دارد ، مشخص کنیم. سطح اطمینان را معمولاً 95 یا 99 درصد اطمینان ، انتخاب کرده، آنگاه محدوده مقادیر را بدست می‌آوریم. با فاصله اطمینان 95 درصدی، می‌گوئیم که اگر ما فاصله اطمینان برای 100 نمونه مختلف از یک جامعه را بدست آوریم آنگاه 95 درصد از آن فاصله‌های اطمینان باید حاوی مقدار میانگین جامعه باشند. بنابراین فاصله اطمینان، برآورد خوبی برای مشخص کردن مکان وجود میانگین واقعی است.

در مثال بالا به سادگی می‌توانیم فاصله اطمینان 95 درصدی را بدست آوریم همانگونه که از اطلاعات تولید شده خودمان برای بدست آوردن t استفاده کردیم. زیرا در آزمون t فاصله اطمینان (CI) به شکل زیر مشخص شده است.

                                      (خطای استاندارد میانگین × نقطه بحرانی t ) ± میانگین نمونه = CI

در این حالت مقدار بحرانی t، آنی است که 95 درصد مرکز توزیع را در بر می‌گیرد و فقط 5 درصد خارج از این محدوده باقی می‌ماند و مقدار دو طرفه t از جدول که در آن p=0.05 باشد، محدوده‌ای 025.0 از هر طرف توزیع جدا می کند درجه آزادی ما 49 درجه است بنابراین می‌توانیم مقدار بحرانی t را از جدول استخراج کرده که مقدار آن016.2 است. (بوسیله تناسب خطی بین df=40 و df=60). می دانیم که میانگین نمونه 30 و خطای استاندارد میانگین (برآورد شده) 922.1 است (زیرا بخش پائینی فرمول آزمون t می‌باشد) بنابراین داریم:

                                                    3982.2 ± 30 = 1922.1 × 0116.2 ± 30 = CI %95

که به ما میدهد

                                                                                                                                                                                                                                                           (3982.32 و 6018.27 ) = CI %95

این نشانه سودمندی از موقعیت واقعی میانگین جامعه است. هرچه فاصله اطمینان کوتاهتر باشد تخمین ما از میانگین جامعه دقیق‌تر خواهد بود. در اینجا مطمئن هستیم که میانگین جامعه بین 6018.27 و 3982.32.قرار دارد حتی کمترین مقدار این دو محدوده هنوز بخوبی بالای مقدار 25 قلم خرید قبل از تبلیغات است.

می‌توان از آنالیز فاصله اطمینان خود برای بدست آوردن فواصل اطمینان برای مقدار میانگین قبل و بعد از تبلیغات استفاده کنیم. از همان فرمول استفاده کرده ولی میانگین نمونه را با اختلاف میانگین‌ها عوض می‌کنیم.

        (انحراف استاندارد اختلاف میانگین‌ها × مقدار بحرانی t) ± اختلاف میانگین‌ها = CI

مقدار بحرانی t و خطای استاندارد همانها هستند که در محاسبه قبلی به کار بردیم و مقدار  را هم می‌دانیم بنابراین:

 (1922.1 × 0116.2) ± (25 – 30) =CI  %95

           (3982.7 و 6018.2) = CI %95

این به ما محدوده‌ای از مقادیر را داده که مطمئن هستیم (95 درصد اوقات) حاوی اختلاف در جامعه است. توجه کنید که در بدترین حالت (حد پائین‌تر) انتظار 60.2 فروش بیشتر را بعد از تبلیغات داریم، بنابراین می‌توانیم مطمئن باشیم که تبلیغات اثر داشته است. اگر حد پائین‌تر صفر یا منفی باشد قادر نخواهیم بود که اثر مشخصی را برای تبلیغات فرض کنیم زیرا اختلاف واقعی صفر خواهد بود.

 

ساختار عمومی یک فاصله اطمینان

فاصله اطمینان بالا با استفاده از آماره های ساده (میانگین، تفاوت میانگین‌ها)، اطلاعات ساده (خطای استاندارد) و توزیع آماری مناسب داده‌ها (توزیع t) حاصل شده است. فاصله اطمینان برای بسیاری از تحلیلهای آماری را می‌توان با همان ساختار بالا محاسبه نمود ولی دستور کلی را به شکل زیر می‌نویسیم:

خطای استاندارد آماره × مقدار بحرانی توزیع مقتضی ± مقدار آمار = CI

پس از آن نیاز است که قلم آماری مناسب، مقدار بحرانی و خطای استاندارد برای محاسبه فاصله اطمینان را برگزینیم، همانطور که در بالا دیدیم آماره را بدست آورده و خطای استاندارد داده خود را برآورد می کنیم و سطح اطمینانی را که مایلیم برمی‌گزینیم (90 یا 95 درصد) ، آنگاه مقدار بحرانی درست را برای آن سطح اطمینان انتخاب می‌کنیم.

 

فواصل  اطمینان و معنی داری

آزمونهای معنادار بودن و فاصله‌های اطمینان هر دو قصد دارند که به یک پرسش پاسخ دهند:

اطلاعات نمونه ما درباره مقدار جامعه چه می‌گویند و از آن چه چیزی را می‌توانیم استنتاج کنیم؟

در مورد اول، یعنی آزمون معنادار بودن، در جستجوی آن هستیم که آیا آماره از یک معیار ویژه (سطح معنی داری p=0.05) فراتر می‌رود تا مدعی معنادار بودن آن آماره شویم (و فرضیه صفر را رد کنیم). در مورد دوم، یعنی فاصله اطمینان، در جستجوی، یافتن محدوده‌ای هستیم که در آن مطمئن باشیم که مقدار جامعه در آن موجود است. اگر به سطح اطمینان یک تفاوت  نظر بیفکنیم می‌توان این محدوده را به نسبت صفر آزموده تا به ما نشانه‌ای بدهد که آیا فکر می‌کنیم این تفاوت مهم است یا خیر.

اگر فاصله اطمینان شامل صفر باشد آنگاه تفاوت برای مقادیر جامعه صفر خواهد بود و بدین دلیل هر تفاوتی که در میانگین‌های نمونه‌ها بیابیم اهمیتی نخواهد داشت.

آزمون معنادار بودن به صورت سنتی در تعدادی از بخش‌های آنالیز داده‌ها به کار میرود.اما استفاده ازفاصله اطمینان به صورت روز افزونی در حال افزایش است.

این بخاطر آن است که آزمون معنادار بودن یک خروجی «این یا آن» دارد یعنی یا فرضیه صفر مردود می‌شود و یا آن در یک سطح خاص معنادار نیست، در حالیکه فاصله اطمینان محدوده‌ای از مقادیر را که برآورد سودمندی از اندازه تفاوت بوده را به ما عرضه می‌کند. در حقیقت آزمونهای معنادار بودن و فاصله‌های اطمینان مکمل یکدیگر در آشکار کردن یک تصویر واضح‌تر از داده‌ها هستند فراتر از آنچه ممکن است به تنهایی قادر به آن باشند. در بسیاری از حالات (با یافته‌های بسیار قابل ملاحظه‌ای بطور مثال) نتیجه‌گیری روشن است اما جائیکه یافته‌ها نزدیک به معنادار بودن باشند (مثلا با احتمال 06.0، که می‌توانیم بگوئیم معنی دار نیست) فاصله‌های اطمینان به ما کمک می‌کنند که ارزش تحقیقات بیشتر را سنجیده ، بویژه اگر ، همانگونه که در فصل 9 خواهیم دید ، تعدادی فاکتور موثر بر خروجی آمار ما موجود باشد.

 

آزمون فرضیه با یک نمونه: نتیجه‌گیری

خواه یک نمونه و خواه یک نمره جداگانه را بیازمائیم، همان منطق اعمال خواهد شد.  به هر حال با استفاده از نمونه «نمره از توزیع ناشناخته » به  میانگین نمونه از توزیع نمونه گیری ناشناخته تبدیل می شود و ما آن را با میانگین نمونه های توزیع شناخته شده که از نمونه هایی با همان اندازه به دست آمده اند، مقایسه می کنیم. وقتیکه جزئیات نمره و توزیع شناخته شده را داشته باشیم آنگاه روال کار یکسان است: مقدار Z را بدست آورده و احتمال آن را پیدا می‌کنیم تا تصمیم بگیریم که فرضیه صفر را پذیرفته یا آن را رد کنیم. اگر انحراف استاندارد جامعه شناخته شده را نداشته باشیم این کار کمی پیچیده‌تر خواهد بود اما زمانیکه فرض مناسبی را بپذیریم می‌توانیم انحراف استاندارد نمونه را برای تقریب آن به کار ببریم. آنگاه به جای z ، t را محاسبه می‌کنیم. از آنجائیکه تمامی مقادیر t بدست آمده است می‌توانیم بدنبال مقدار t با درجه آزادی متناسب، برای انتخاب سطح معنادار بودن بگردیم. اگر مقدار محاسبه شده ما از مقدار جدول بزرگتر بود می‌توان فرضیه صفر را رد کرد.

فاصله‌های اطمینان راه جایگزینی برای نمایش یافته‌هایمان عرضه می‌کند زیرا محدوده‌ای از مقادیر را که مطمئن هستیم مقدار جامعه در آن است به ما میدهد.   این را می توان به عنوان راه جایگزین برای آزمون معنادار بودن برگزیده یا آن را به عنوان اطلاعات تکمیلی برای آن تلقی کنیم.

 

اشتراک گذاری در شبکه های اجتماعی
@

لطفا شکبیا باشید...