آمار به زبان ساده – نمرات استاندارد

21 مرداد 1400

دقیقه

نمرات استاندارد مقایسه نمرات در توزیع‌های مختلف اگر در آزمونی نمره 58 گرفته باشید آیا می‌دانید عملکرد شما نسبت به بقیه چقدر خوب بوده است؟ آیا در کلاس بهترین بوده‌اید یا بدترین؟ بوضوح روشن بوده در این حالت نیاز به اطلاعات بیشتری وجود دارد. با استفاده از میانگین و انحراف استاندارد می‌توانید شروع به پاسخ...

نمرات استاندارد

مقایسه نمرات در توزیع‌های مختلف

اگر در آزمونی نمره 58 گرفته باشید آیا می‌دانید عملکرد شما نسبت به بقیه چقدر خوب بوده است؟

آیا در کلاس بهترین بوده‌اید یا بدترین؟ بوضوح روشن بوده در این حالت نیاز به اطلاعات بیشتری وجود دارد. با استفاده از میانگین و انحراف استاندارد می‌توانید شروع به پاسخ دادن به این سوالها کنید. اگر میانگین 52 باشد و انحراف استاندارد 5 ، نمره شما یکی از بهترین‌ها خواهد بود. اما اگر میانگین 59 باشد و انحراف استاندارد 3، شما کمی زیر متوسط کلاس هستید. از تجمع نمرات اطراف 59 (میانگین) می توان دریافت که احتمالاً بسیاری از دانشجویان نمرات مشابهی گرفته‌اند.

اگر دو امتحان داده اید و در روانشناسی 58 و در آمار 49 گرفته باشید کدامیک بیشتر شما را خوشحال خواهد کرد؟ ممکن است بخواهید از نتیجه این دو امتحان، برای تصمیم‌گیری درباره انتخاب رشته تحصیلی خود از میان این دو کمک بگیرید. ممکن است 58 را انتخاب کنید چون از لحاظ عددی بزرگتر است. اما اگر دریابید بقیه دانشجویانی که در آزمون روانشناسی شرکت کرده‌اند بالای 60 و همه آنهایی که در امتحان آمار شرکت کرده‌اند زیر 45 نمره گرفته‌اند شاید نظرتان عوض شود. اگرچه نمره شما در روانشناسی بیشتر است ولی توزیع نمرات در دو آزمون متفاوت است. علت می‌تواند آن باشد که آزمون آمار بسیار سخت بوده و 49 نسبت به بقیه افراد کلاس، نمره خیلی بالایی است در حالیکه نمره 58 کلاس روانشناسی به نسبت نمره پائینی است.

پس از آن در می‌یابید که در آزمون آمار نمره میانگین 45 و انحراف استاندارد 4 بوده و در روانشناسی نمره میانگین 55 و انحراف استاندارد 6 می‌باشد. حداقل این اطلاعات به شما می‌گوید که در هر دو آزمون نمره شما بالای متوسط بوده است ولی نمی‌تواند به شما بگوید که در کدام رتبه بالاتری کسب کرده‌اید.

برای مقایسه دو نمره که از دو توزیع متفاوت هستند باید آنها را استاندارد کنیم. برای این کار از یک آماره که آن را نمره استاندارد (یا نمره Z) می‌نامیم استفاده می‌کنیم.

این آماره نمره را نسبت به میانگین برحسب انحراف استاندارد بیان می کند.  بنابراین نمره 58 باندازه 3 از نمره میانگین یعنی 55 بالاتر است. با داشتن انحراف استاندارد 6، این فاصله  انحراف استاندارد است. نمره‌ ما نصف انحراف استاندارد از میانگین است. اساساً نمره استاندارد به ما می‌گوید نمره موردنظر چند برابر انحراف استاندارد ، از میانگین توزیع نمرات فاصله دارد. نمره استاندارد را با استفاده از این فرمول محاسبه می‌کنیم:

   

که در آن X نمره‌ای که باید استاندارد شود،  میانگین و  انحراف استاندارد توزیع است. نمرات استاندارد را می‌توان مقایسه کرد زیرا مهم نیست که توزیع شما دوست دارد از کجا شروع شود، چون در تبدیل نمرات به نمره استاندارد، نتیجه همیشه توزیعی با میانگین صفر و انحراف استاندارد 1 خواهد بود. اگر نمرات آزمونها را به نمرات استاندارد تبدیل کنیم آنگاه می‌توانیم آنها را با هم مقایسه کرده و ببینیم در کدام آزمون جایگاه بالاتری در کلاس داریم.

در روانشناسی شما به اندازه نصف انحراف استاندارد بالای میانگین بوده و در آمار به اندازه یک انحراف استاندارد بالای میانگین می باشید. نمره استاندارد بالاتر در کلاس آمار معنایش آن است که شما در کلاس آمار رتبه بالاتری از کلاس روانشناسی دارید.

در فصل گذشته مجموع نتایج امتحان دو گروه را در امسال و سال گذشته مقایسه کردیم. توجه کنید نمره 59 امسال به ما نمره استاندارد زیر را می‌دهد.

و توزیع نمرات سال گذشته، نمره استاندارد زیر را تولید می‌کند.

از مقایسه این دو نمره استاندارد (Z) می‌بینیم که نمره 59 در توزیع نمرات امسال (Z=0/48) از توزیع نمرات پارسال (Z=0/36) جایگاه بالاتری دارد.

بنابراین نمره 59 امسال بهتر از سال گذشته است احتمالاً بدلیل سخت تر بودن امتحان امسال (یا یکی از دلایل دیگری که پیش از این ذکر شد).

توزیع نرمال

اگر من تصمیم به جمع‌آوری داده‌ها در مورد چیزی مثل قد خانمها بگیرم ممکن است ابتدا قد تعداد زیادی از آنها را اندازه بگیرم و نتایج توزیع فراوانی را به صورت هیستوگرام رسم ‌کنم. این نمودار شبیه چه چیزی خواهد بود؟ کار را با انتخاب پله‌های هیستوگرام آغاز کرده و تصمیم می‌گیرم که محدوده مقادیر برای هر میله چه مقدار باید باشد. 5 سانتی‌متر را برای هر مرحله برگزیده و همه زنانی را که قدشان در یک محدوده نوار 5 سانتی‌متری خاص قرار دارند در یک میله می‌گنجانیم. (برای جلوگیری از روی هم افتادن نوارها، نوار را از کمترین مقدار شروع کرده اما بیشترین مقدار را در نوار نمی‌گنجانم: برای مثال در نوار 160 تا 165 سانتی‌متر زنانی را که قدی بین 160 تا 165 دارند پوشش می‌دهد اما خود 165 در این نوارها گنجانیده نمی‌شود و در باند بالایی 165 تا 170 گنجانیده می‌شود). وقتی داده‌ها را جمع کردم و زنانی را که در یک باند 5 سانتی‌ به هم اضافه کردم، زنان زیادی را خواهم یافت که قدشان بین 160 تا 165 سانتی‌متر یا 165 تا 170 سانتی‌متر است. اما ممکن است زنان زیادی را با قد بین 135 تا 140 یا 185 تا 190 سانتی‌متر نیابیم. در مقایسه با زنان میان قد ، زنان قدبلند یا قدکوتاه زیادی وجود ندارد. در واقع توزیع محتملاً شبیه هیستوگرام تصویر 3.1 به نظر خواهد رسید. توجه کنید توزیع برآمدگی کوهان شکل در میانه دارد که به صورت متقارن در دو طرف کم می‌شود.

مقاله های مرتبط:   آمار به زبان ساده - معنی داری، خطا و توان

تصویر 3.1 : توزیع بلندی قد خانمها : هیستوگرام

اگر در ادامه قد زنان زیادتری را اندازه‌گیری کرده و پله‌ها را کوچکتر کنم (به جای 5 سانتی‌متر باندهای 2 سانتی‌متری را برگزینم و بعد 1 سانتی‌متری و بعد از آن 5/0 سانتی‌متری و بهمین ترتیب تا جائیکه باندها فوق‌العاده کوچک شوند). در نهایت کار را با تعداد زیادی اندازه‌ قد خانمها که روی هیستوگرام در فواصل خیلی کوچک رسم شده به پایان می‌رسانم. بتدریج هیستوگرام تبدیل به یک منحنی صاف همانند آنچه در شکل 3.2 آمده، خواهد شد.

تصویر 3.2 : توزیع بلندی قد خانمها

فارغ از آنکه مشغول مطالعه چه متغیری باشیم بلندی قد خانمها باشد یا اندازه پای پسران ده ساله و یا دوره بارداری نوزادان ، جالب توجه است که در موارد بسیاری کار به همین منحنی زنگوله شکل ختم می گردد. از آنجائیکه این منحنی اغلب اوقات در موارد طبیعی تولید می‌شود، آن را توزیع نرمال می‌نامند. خاصیت جالب و بسیار مفید این منحنی آن است که برای توصیف ریاضی بسیار ساده است و می‌تواند تنها با استفاده از میانگین و انحراف استاندارد محاسبه شود. یعنی می‌توانیم فرمولی برای توزیع نرمال به صورت دقیق بسازیم که تنها نیاز به دانستن‌ میانگین و انحراف استاندارد دارد. توزیع نرمال به دلایل زیر برای تحلیل آماری بسیار مهم است.

در بسیاری از مواردی که ما در تحقیق‌هایمان مطالعه کرده و اندازه‌گیری می‌کنیم (اگرچه نه همه آنها) فرض بر این گذاشته می‌شود که از جامعه‌هایی می‌آیند که نمرات آنها به صورت نرمال توزیع شده‌اند (مثل قد خانمها)، اگر همه مردهای جامعه را در نظر بگیریم باید انتظار داشته باشیم که برای قد، وزن، اندازه پا و غیره، توزیع نرمال داشته باشند. برای داده‌های خانمها هم بهمین ترتیب باید  توزیع نرمال را انتظار داشته باشیم.

بسیاری از آزمایشهای آماری که در طول این کتاب مورد بررسی قرار می‌دهیم بر این فرض بنا شده‌اند که توزیع مورد تحقیق قرار گرفته شده، توزیع نرمال است. بطور قطع این آزمایشها بر این فرض بنا شده‌اند، بدون این مسئله منطق این آزمایشها خطاست.

جالب است که  حتی اگر توزیعی ، توزیع نرمال نباشد، وقتی که تعداد زیادی نمونه از همان اندازه می‌گیریم و میانگین آنها را روی توزیع فراوانی رسم می‌کنیم. این توزیع به یک توزیع نرمال متمایل می‌شود. این امر مجددا برای تحلیلهای آماری بی‌نهایت مفید است.

در فصل 5 وقتی نمونه‌ها را مورد ملاحظه قرار میدهیم این نکات را می‌آزمائیم. مهمترین چیزی که باید به آن توجه کنیم آن است که وقتی میانگین و انحراف استاندارد یک مجموعه از داده‌ها را داشته باشیم که توزیع آن توزیع نرمال باشد ، اطلاعات سودمند بسیار زیادی داریم.

توزیع نرمال استاندارد

از آنجائیکه توزیع نرمال ، توزیع بسیار مفیدی است جداول زیادی درباره توزیع نرمال ترسیم شده است. اما چون مقادیر برای میانگین‌ها و انحراف استانداردهای مختلف، متفاوت خواهد بود در پایان جداول متفاوت زیادی درست خواهد شد. بنابر این داده های جدول برای توزیع نرمالی است که میانگین آن صفر و انحراف استاندارد یک داشته باشد. این توزیع نرمال ، توزیع نرمال استاندارد نامیده می شود.

اگر داده ها از توزیع نرمالی آمده باشند  (مانند قد، وزن) آنگاه آنها را به نمرات استاندارد تبدیل کنیم            (Z scores) در آن صورت توزیع ما به توزیع نرمال استاندارد تبدیل خواهد شد. وقتیکه نمرات را از توزیع نرمال به نمرات استاندارد (Z scores) تبدیل کنیم آنگاه می‌توانیم به نمرات استاندارد در جداول توزیع نرمال استاندارد مراجعه کنیم. این جدول در ضمیمه 1 کتاب آمده است. این اطلاعات می‌تواند بطور قابل ملاحظه‌ای در تحلیلهای آماری مفید باشد.

این جدول به ما می‌گوید چه تعداد نمره در توزیع بزرگتر از نمراتی است که ما می‌آزمائیم. جدول این کار را با ارائه رقمی برای مساحت زیر منحنی استاندارد در مقابل نمره z که در شکل 3.3 نشان داده شده، انجام میدهد. مساحت زیر منحنی برابر یک است (ما یک مساحت داریم مثل یک کیک پیش از آنکه او را به قسمتهای مختلف برش دهیم) و نمره z (مثل چاقویی که کیک را می‌برد) آن را به دو بخش تقسیم می‌کند و جدول به ما می‌گوید مساحت برش داده شده مقابل نمره z چه نسبتی از کل مساحت زیر منحنی دارد. اگر این مقدار را از یک کم کنیم می‌فهمیم چقدر از مساحت، زیر نمره Z است. همچنین از آنجائیکه منحنی متقارن است میانگین آن را به دو بخش مساوی تقسیم می‌کند (و بنابراین نیمی از مساحت بالای میانگین و نیمی دیگر زیر میانگین است).

مقاله های مرتبط:   اوراق بهادار هیبریدی (بخش دوم)

                  

تصویر 3.3 : توزیع نرمال استاندارد

در این حالت نسبتها به احتمالات پیوند می‌خورد. قد من 180 سانتی‌متر است. بخاطر این مثال بیائید فرض کنیم نسبت مردان بلندقدتر از من در جامعه یک پنجم است. اکنون یک پنجم، یعنی یک تقسیم بر 5 که مساوی2/0 می‌شود. بنابراین می‌توانیم بگوئیم نسبت مردان بلندقدتر از من در جامعه 2/0 کل است. از این اطلاعات همچنین می‌فهمیم که شانس یا احتمال پیدا کردن یک مرد بلندقدتر از من در جامعه یک به پنج یا 2/0 است. از این طریق است که ناحیه زیر منحنی با شانس و احتمالات پیوند می‌خورد. مساحت کل منحنی (1) با احتمال 1 پیوند می‌خورد. مقادیر محتمل دامنه‌ای بین صفر تا 1 دارند. شانس 1 یعنی موردی قطعاً در این حالت وجود دارد. قطعی است که هر مردی که من بیابم قدی دارد که در جایی در توزیع قد مردان جای می‌گیرد بنابراین کل مساحت بطور قطع شامل او خواهد شد. شانس صفر، یعنی قطعی است که چیزی در این حالت وجود ندارد. شانس یافتن مردی با قد دوبرابر من (360 سانتی‌متر) آنقدر کوچک است که مجازاً صفر فرض می‌شود. همانطور که از شانس صفر به سوی شانس یک حرکت می‌کنیم مساحت ما از صفر بزرگتر و بزرگتر شده تا کل مساحت زیر منحنی را در بر گیرد.

وقتی افراد از شانس اتفاق افتادن چیزی صحبت می‌کنند، اغلب اصطلاحات علم آمار و احتمالات را به کار نمی‌برند. (شانس قبول شدن من در امتحان 5/0 است). برعکس آنها استفاده از درصد را ترجیح می‌دهند  (من برای قبول شدن در امتحان 50 درصد شانس دارم). رابطه ساده‌ای بین احتمال و درصد وجود دارد، درصد برابر است با احتمال ضربدر 100 . بنابراین احتمال 3/0 مساوی با 30 درصد است.

با نظر کردن به مساحت منحنی توزیع نرمال استاندارد، در بالا یا زیر نمره z می‌توانیم احتمال یافتن یک نمره بزرگتر یا کوچکتر از توزیع را ، از نمره‌ای که ما انتخاب کرده‌ایم بدست آوریم. با این روش قادر خواهیم بود که دامنه کامل احتمالات جالب مربوط به نمرات را در یک توزیع نرمال به دست آوریم.

یک مثال از کاربرد جدول توزیع نرمال استاندارد

توزیع نمرات در یک امتحان آمار نرمال بوده، میانگین نمرات 45 و انحراف استاندارد 4 می‌باشد. شما در این آزمون نمره 49 گرفته‌اید.

الف) چقدر احتمال می‌رود که کسی نمره بالاتر از شما بگیرد.

ب) چند درصد از افراد نمره بالای میانگین و زیر نمره شما دارند.

از آنجائیکه ما یک توزیع نرمال داریم محاسبه نمره z توزیع ما را به توزیع نرمال استاندارد تبدیل خواهد کرد. نمره 49، نمره z به شرح زیر می‌دهد.

 

جدول توزیع نرمال استاندارد (جدول A.1 در ضمیمه کتاب) احتمال نمره‌ای بزرگتر از نمره z شما که برابر یک است را به ما نشان می‌‌دهد. به دنبال نمره Z در جدول گشته و رقم 1587/0 را بدست می‌آوریم، بنابراین احتمال نمره‌ای بالاتر از 49 برابر 1587/0 می‌باشد (این بدین معناست که شما جزء 16 درصد بالای کلاس هستید زیرا 87/15%= 100 × 1587/0 درصد از نمرات بهتر از شما هستند). می‌دانیم که مساحت بالای میانگین 5/0 (نصف مساحت) بوده و احتمال نمره‌ای بزرگتر از نمره z شما یعنی یک ، عدد 1587/0 می‌باشد. بنابراین اگر این عدد را از 5/0 کم کنیم احتمال نمرات بالای میانگین وزیر نمره 49 را خواهیم یافت. 3413/0 = 1587/0 – 5/0 که اگر این نمره را در صد ضرب کنیم 13/34 درصد را به دست خواهیم آورد. یعنی 13/34 درصد از نمرات بالاتر از میانگین و زیر نمره شما هستند.

نمره Z کمتر از صفر

اگر نمره Z  را محاسبه کرده و عددی منفی بدست آوریم معنایش این است که این نمره زیر میانگین می‌باشد. همانطور که از جدول توزیع نرمال استاندارد می‌توان دید در آنجا نمره منفی برای z وجود ندارد. بهرحال همانطور که دیده‌ایم توزیع نرمال متقارن بوده بنابراین نسبت نمرات بزرگتر از میانگین مثلا 52/1 + ، همان نسبت نمرات کوچکتر از آن یعنی 52/1- است. اگر به دنبال نمره‌ای منفی در جدول می‌گردید علامت منفی را حذف کرده و عدد را بیابید. عددی که شما از جدول می‌گیرید به شما احتمال یک نمره کمتر از نمره Z را میدهد. برای یافتن احتمال نمرات بزرگتر از نمره Z، عدد بدست آمده از جدول را از یک کم کنید. برای مثال اگر نمره Z ما برابر 1- شد. این بدین معناست که نمره ما زیر میانگین است. در جدول 1- نداریم. علامت منفی را نادیده گرفته و بدنبال 1 می‌گردیم. مقدار احتمال 1587/0 است. این به ما می‌گوید که احتمال نمره‌ای کمتر از نمره Z ، یعنی 1- برابر 1587/0 است و احتمال نمره Z بالاتر از 1- برابر 8413/0 = 1587/0 – 1 می‌باشد.

 

اشتراک گذاری در شبکه های اجتماعی
@

لطفا شکبیا باشید...