به کررات این واژه را در آزمونهای آماری میبینیم که دو یا چند گروه از نظر میانگین با یکدیگر اختلاف معنی دار دارند. یا میانگین یک توزیع اختلاف معنی داری با عدد مشخصی دارد.
مثال زیر را ببینید: دو کلاس درس داریم، نمره درس ادبیات دانش اموزان را در دو کلاس نشان می دهیم.
ادامه مطلب ...
مثالی که همیشه سر کلاسهای درس میزنم:
فرض کنید شما دو قطعه شمش طلا دارید که این دو مقدار کمی اختلاف وزن دارند اختلاف در حدی است که برای شما قابل قبول است ولی ممکن است ترازویی با دقت پایین نتواند این اختلاف کم، اما معنی دار را نشان دهد.
شما دو شمش طلا را با ترازوی سوپر مارکت اندازه گیری میکنید این ترازو هر دو قطعه را 50 گرم نشان می دهد. این شمش را با ترازوی طلا فروشی اندازه گیری میکنید، ترازو وزن قطعات را 50.1 و 50.6 گرم نشان می دهد. نشان میدهد که یکی از قطعات 0.5 گرم از قطعه دیگر سنگین تر است. این ترازو اختلاف وزن را توانست نشان دهد. یعنی این ترازو از توان بیشتری برای نشان دادن این اختلاف برخوردار است. اینجا ترازو همان آزمون آماری است. برخی آزمونها با وجود اختلاف معنی دار بین دو جامعه قادر به شناسایی این اختلاف نیستند و از توان کمی برخوردار هستند.
برای افزایش توان آزمون روشهای مختلفی وجود دارد. افزایش حجم نمونه، همسان سازی و استفاده از طرح مناسب در مطالعات طرح آزمایشها
متغیر تصادفی: مقداری که از نمونه ای به نمونه دیگر به صورت تصادفی تغییر می کند.
متغیرها به دو دسته کمی و کیفی تقسیم می شوند.
انواع متغیرهای کمی و کیفی در شکل زیر نمایش داده شده است.
آمار توصیفی: برای توصیف متغیرهای کمی از نظر شاخصهای مرکزیت و پراکندگی از معیارهای مختلفی استفاده میکنیم و برای متغیرهای کیفی از فراوانی و درصد فراوانی استفاده میکنیم.
شاخص مرکزیت:
میانگین حسابی: برای انواع متغیرهای کمی مورد استفاده قرار میگیرد. در صورت متقارن بودن توزیع دادهها و عدم وجود داده های پرت بهترین معیار می باشد.
محاسبه میانگین حسابی:
میانه: در صورتی که داده ها چولگی به راست یا چپ داشته باشند مورد استفاده قرار میگیرد.
محاسبه میانه:
مرتب کردن دادهها از کوچک به بزرگ
اگر تعداد دادهها فرد باشد، میانه مقدار وسط میباشد.
دادهها: 2 8 3 4 1
دادههای مرتب شده 1 2 3 4 8 میانه برابر عدد 3 می باشد.
اگر تعداد دادهها زوج باشد، میانه متوسط دو مقدار وسطی است
دادهها : 2 8 3 4 1 8
دادههای مرتب شده 1 2 3 4 8 8 :
میانه (3+4)/2 = 3.5
شاخص پراکندگی:
واریانس و انحراف معیار: انحراف معیار به توان دو برابر با واریانس است.
دامنه: اختلاف بین کمترین و بیشترین مقدار مورد. Max-Min
انواع نمودارهای Histogram، Scatter plot یا نمودار پراکندگی، Line یا خط، Box Plot یا جعبه ای برای متغیرهای کمی مورد استفاده قرار میگیرد
برای توصیف متغیرهای کیفی از انواع نمودارهای Pie یا دایره ای، Bar یا ستونی و .... استفاده میکنیم.
در بسیاری از تحلیل های آماری نیازمند انجام انواع آزمون های پارامتری مانند ANOVAو آزمون t می باشیم. یکی از شروط مهم انجام آزمون نرمال بودن متغیرها میباشد. البته برای داده های با حجم نمونه بالا آماره آزمون طبق قضیه حد مرکزی به نرمال میل میکند و درصورتی که فرض نرمالیتی برقرار نباشد همچنان می توان از برخی از این آزمونها استفاده نمود.
ادامه مطلب ...
گاهی اوقات نمودارها اطلاعاتی به ما میدهند که هیچ یک از آمارهای توصیفی یا تحلیل نمیدهند.قبل از انجام هر تحلیل ارتباط بین نمودار ها یا نسبت گونه ها در یک متغیر را با نمودارها بررسی نمایید. مطمئن باشید دید خیلی خوبی در باره تحلیل هایتان بدست خواهید آورد.
در بعضی مواقع به خود داده ها دسترسی نداریم و فقط یک جدول 3*3 داریم (مانند پایین)که تعداد نفرات را نشان میدهد. نحوه تعریف
متغیرها در این داده ها متفاوت است.
ادامه مطلب ...
کار برد کددهی: فرض کنید متغیر سن را به صورت یک متغیر کمی وارد نموده اید و سن دقیق افراد را به سال وارد کردید.
حال می خواهید افراد را به چهار گروه سنی تقسیم کنید: کمتر از 20 سال- 21 تا 35 سال- 36 تا 45 سال و گروه آخر بالای 46 سال
ادامه مطلب ...
امروز نحوه محاسبه امار توصیفی برای داده های کمی و کیفی و نحوه Split کردن داده ها را توسط متغیری خاص توضیح می دهیم.
ادامه مطلب ...