مثالی که همیشه سر کلاسهای درس میزنم:
فرض کنید شما دو قطعه شمش طلا دارید که این دو مقدار کمی اختلاف وزن دارند اختلاف در حدی است که برای شما قابل قبول است ولی ممکن است ترازویی با دقت پایین نتواند این اختلاف کم، اما معنی دار را نشان دهد.
شما دو شمش طلا را با ترازوی سوپر مارکت اندازه گیری میکنید این ترازو هر دو قطعه را 50 گرم نشان می دهد. این شمش را با ترازوی طلا فروشی اندازه گیری میکنید، ترازو وزن قطعات را 50.1 و 50.6 گرم نشان می دهد. نشان میدهد که یکی از قطعات 0.5 گرم از قطعه دیگر سنگین تر است. این ترازو اختلاف وزن را توانست نشان دهد. یعنی این ترازو از توان بیشتری برای نشان دادن این اختلاف برخوردار است. اینجا ترازو همان آزمون آماری است. برخی آزمونها با وجود اختلاف معنی دار بین دو جامعه قادر به شناسایی این اختلاف نیستند و از توان کمی برخوردار هستند.
برای افزایش توان آزمون روشهای مختلفی وجود دارد. افزایش حجم نمونه، همسان سازی و استفاده از طرح مناسب در مطالعات طرح آزمایشها
متغیر تصادفی: مقداری که از نمونه ای به نمونه دیگر به صورت تصادفی تغییر می کند.
متغیرها به دو دسته کمی و کیفی تقسیم می شوند.
انواع متغیرهای کمی و کیفی در شکل زیر نمایش داده شده است.
آمار توصیفی: برای توصیف متغیرهای کمی از نظر شاخصهای مرکزیت و پراکندگی از معیارهای مختلفی استفاده میکنیم و برای متغیرهای کیفی از فراوانی و درصد فراوانی استفاده میکنیم.
شاخص مرکزیت:
میانگین حسابی: برای انواع متغیرهای کمی مورد استفاده قرار میگیرد. در صورت متقارن بودن توزیع دادهها و عدم وجود داده های پرت بهترین معیار می باشد.
محاسبه میانگین حسابی:
میانه: در صورتی که داده ها چولگی به راست یا چپ داشته باشند مورد استفاده قرار میگیرد.
محاسبه میانه:
مرتب کردن دادهها از کوچک به بزرگ
اگر تعداد دادهها فرد باشد، میانه مقدار وسط میباشد.
دادهها: 2 8 3 4 1
دادههای مرتب شده 1 2 3 4 8 میانه برابر عدد 3 می باشد.
اگر تعداد دادهها زوج باشد، میانه متوسط دو مقدار وسطی است
دادهها : 2 8 3 4 1 8
دادههای مرتب شده 1 2 3 4 8 8 :
میانه (3+4)/2 = 3.5
شاخص پراکندگی:
واریانس و انحراف معیار: انحراف معیار به توان دو برابر با واریانس است.
دامنه: اختلاف بین کمترین و بیشترین مقدار مورد. Max-Min
انواع نمودارهای Histogram، Scatter plot یا نمودار پراکندگی، Line یا خط، Box Plot یا جعبه ای برای متغیرهای کمی مورد استفاده قرار میگیرد
برای توصیف متغیرهای کیفی از انواع نمودارهای Pie یا دایره ای، Bar یا ستونی و .... استفاده میکنیم.
در بسیاری از تحلیل های آماری نیازمند انجام انواع آزمون های پارامتری مانند ANOVAو آزمون t می باشیم. یکی از شروط مهم انجام آزمون نرمال بودن متغیرها میباشد. البته برای داده های با حجم نمونه بالا آماره آزمون طبق قضیه حد مرکزی به نرمال میل میکند و درصورتی که فرض نرمالیتی برقرار نباشد همچنان می توان از برخی از این آزمونها استفاده نمود.
ادامه مطلب ...