متغیر تصادفی: مقداری که از نمونه ای به نمونه دیگر به صورت تصادفی تغییر می کند.
متغیرها به دو دسته کمی و کیفی تقسیم می شوند.
انواع متغیرهای کمی و کیفی در شکل زیر نمایش داده شده است.
آمار توصیفی: برای توصیف متغیرهای کمی از نظر شاخصهای مرکزیت و پراکندگی از معیارهای مختلفی استفاده میکنیم و برای متغیرهای کیفی از فراوانی و درصد فراوانی استفاده میکنیم.
شاخص مرکزیت:
میانگین حسابی: برای انواع متغیرهای کمی مورد استفاده قرار میگیرد. در صورت متقارن بودن توزیع دادهها و عدم وجود داده های پرت بهترین معیار می باشد.
محاسبه میانگین حسابی:
میانه: در صورتی که داده ها چولگی به راست یا چپ داشته باشند مورد استفاده قرار میگیرد.
محاسبه میانه:
مرتب کردن دادهها از کوچک به بزرگ
اگر تعداد دادهها فرد باشد، میانه مقدار وسط میباشد.
دادهها: 2 8 3 4 1
دادههای مرتب شده 1 2 3 4 8 میانه برابر عدد 3 می باشد.
اگر تعداد دادهها زوج باشد، میانه متوسط دو مقدار وسطی است
دادهها : 2 8 3 4 1 8
دادههای مرتب شده 1 2 3 4 8 8 :
میانه (3+4)/2 = 3.5
شاخص پراکندگی:
واریانس و انحراف معیار: انحراف معیار به توان دو برابر با واریانس است.
دامنه: اختلاف بین کمترین و بیشترین مقدار مورد. Max-Min
انواع نمودارهای Histogram، Scatter plot یا نمودار پراکندگی، Line یا خط، Box Plot یا جعبه ای برای متغیرهای کمی مورد استفاده قرار میگیرد
برای توصیف متغیرهای کیفی از انواع نمودارهای Pie یا دایره ای، Bar یا ستونی و .... استفاده میکنیم.