شاخص های تمایل مرکزی یا معیارهای مرکزی در کنار پراکندگی، شاخهای از آمار توصیفی است. شاخص مرکزی یک خلاصه توصیفی از یک مجموعه داده از طریق یک مقدار واحد است که مرکز توزیع داده را منعکس میکند. شاخص گرایش مرکزی یکی از اساسیترین مفاهیم در آمار است.
این اندازهگیریها نشان میدهند که بیشتر مقادیر در یک توزیع کجا میافتند و همچنین به عنوان موقعیت مرکزی توزیع نامیده میشوند. در آمار سه معیار رایج برای گرایش مرکزی وجود دارد که عبارتند از میانگین، میانه و مد(نما). هر کدام از این معیارها، نقطهی مرکزی را با استفاده از روشی متفاوت محاسبه میکند. انتخاب بهترین معیار گرایش مرکزی به نوع دادهای که دارید بستگی دارد. در اینجا قرار است این شاخصها را معرفی و روش محاسبه کردن آنها را بررسی کنیم.
این شاخه از آمار توصیفی اگرچه اطلاعاتی را در مورد مقادیر فردی در مجموعه داده ارائه نمیکند، اما خلاصهای از کل مجموعه داده را ارائه میدهد.
تعریف مد یا نما در آمار
سادهترین شاخص تمایل مرکزی، نما است که اغلب در دامنه میانی قرار دارد. مد یا نما به عنوان مقداری تعریف میشود که در یک مجموعه، تکرار بیشتری دارد، در واقع مقداری است که بیشتر از همه ظاهر میشود.
مثال: در مجموعه دادههای 2, 4, 5, 5, 6, 7 نما برابر است با عدد 5، زیرا دو بار در مجموعه ظاهر شده است.
اگر در یک توزیع فراوانی، تنها یک عدد وجود داشته باشد که بیشترین فراوانی را دارد، توزیع را یک نمایی یا unimodal مینامند. اما اگر توزیعی دارای دو نما باشد آن را توزیع دونمایی یا biomodal مینامند. در توزیع فراوانی دونمایی اگر دو نما با هم تفاوت زیادی نداشته باشند میتوان میانگین آنها را بدست آورد و به عنوان برآورد نمای توزیع فراوانی استفاده کرد.
دقت کنید نما یا mode یک شاخص آماری معتبر نیست. به دلیل اینکه تنها با توجه به فراوانی مشاهدات محاسبه میشود و کمیت در آن دخالت ندارد.
میانه شاخص های تمایل مرکزی
میانه در آمار مقدار وسط در مجموعه دادهها است زمانی که آنها به ترتیب مرتب شده باشند. ترتیب دادهها یا مشاهدات میتواند به ترتیب صعودی یا نزولی باشد. به بیان دیگر میانه عددی است که اعداد را از نظر تعداد به دو قسمت تقسیم میکند، به طوری که نیمی از اعداد کمتر و نیم دیگر اعداد بیشتر از آن باشند.
مثال: دادههای زیر را در نظر بگیرید:
12 8 20 48 18 45 2 18 30 1 3
این دادهها را ابتدا به ترتیب صعودی مرتب میکنیم، چون تعداد اعداد فرد هستند، عدد ششم (18) میانه میباشند.
محاسبه میانه یا Median
برای محاسبه میانه ابتدا اعداد را از کوچک به بزرگ مرتب میکنیم. اگر تعداد دادهها یا همان اعداد فرد بود عدد وسط به عنوان میانه در نظر گرفته میشود. اگر تعداد اعداد زوج بود میانگین دو عدد وسط را به عنوان میانه انتخاب میکنیم.
انواع میانگین در آمار
میانگین یکی از شاخص های تمایل مرکزی و برآیند یا مرکز ثقل دادهها است. برای محاسبه آن، کافیست مقادیر تمام عبارتها را جمع کرده و بر تعداد آنها تقسیم کنیم. میانگین برای دادههای کمّی قابل استفاده است. استفاده از میانگین و خواص آن، در تجزیه و تحلیل آماری بسیار مفید است. به دلیل اینکه در محاسبه آن تمامی دادهها دخالت دارند. این شاخص تمایل مرکزی دارای انواع مختلفی است که عبارتند از میانگین حسابی، هندسی، هارمونیک یا همساز، متحرک و هموزن. در تعین نوع میانگینی که قرار است استفاده شود نوع دادهها اهمیت دارند.
میانگین حسابی (Arithmetic Mean)
وقتی همه مقادیر با هم جمع میشوند و بر تعداد آنها تقسیم میشود، آن را میانگین حسابی مینمایند.اگر میانگین را با حرف X، دادهها را x و تعداد کل دادهها را با N نشان دهیم.
طبق فرمول روبه رو میتوان آن را محاسبه کرد: X=ΣX/N
میانگین مرکب (Combined mean)
به میانگین گیری از تعدادی میانگین گفته میشود. برای محاسبه میانگین مرکب دو مجموعه از فرمول زیر استفاده میشود:
XT=n1X1+n2X2 / n1+n2
میانگین وزنی (Weighted Mean)
در این میانگین گیری، به جای اینکه دادهها به طور مساوی به میانگین نهایی کمک کنند، برخی از دادهها نسبت به سایر دادهها ارزش یا وزن بیشتری دارند. اگر وزن تمامی آنها برابر باشد، میانگین وزنی برابر است با میانگین حسابی. این نوع میانگین در آمار به ویژه هنگام مطالعهی جمعیتها بسیار رایج است.
فرمول محاسبهی میانگین وزنی:
W = میانگین وزنی
n = تعداد عبارت هایی که باید میانگین آنها حساب شود
Wi= وزن های اعمال شده به مقادیر x
Xi= مقادیر داده به طور میانگین
میانگین هندسی (Geometric Mean)
از میانگین هندسی زمانی استفاده میشود که مشاهدات حاصل از بررسی به صورت درصد، نسبت و دادههای مشابه با این موارد هستند.
فرمول محاسبه: GM =
GM =در عمل برای محاسبه میانگین هندسی، از فرمول بالا استفاده میشود و سپس با آنتی لگاریتم میانگین را به دست میآورند. به همبن دلیل به آن میانگین لگاریتمی هم گفته میشود.
میانگین هارمونیک (Harmonic mean)
اغلب برای محاسبهی میانگین نسبتها یا نرخها استفاده میشود. زمانی کاربرد دارد که ارزش دادهها متفاوت است. برای مثال در متغیر سرعت که نسبت مسافت به زمان است یا قیمت که نسبت پول به کالا است، ارزش دادهها میتواند متفاوت باشد.
برای محاسبه میانگیم همساز یا هارمونیک باید مقادیر xها معکوس و سپس میانگین دادههای عکس شده را محاسبه کرد. در نهایت عدد بدست آمده را معکوس نمود. میتوان ابن گونه گفت زمانی که مخرج کسر ثایت باشد از میانگین حسابی استفاده میشود و زمانی که صورت کسر ثابت و لی مخرج متغیر است میانگیم همساز کاربرد دارد.
فرمول محاسبه : n / (∑1/x_i)
n : تعداد مقادیر موجود در یک مجموعه داده
میانگین متحرک (moving averages)
در مواردی که دادهها به صورت سریهای زمانی (هفتگی، ماهانه، سالیانه) هستند. برای مثال دما، میزان بارندگی و میزان رشد گیاه در دورههای زمانی معین را در نظر بگیرید. در آمار یک سری زمانی با مقادیر مختلف متغیر x در زمانهای t تعریف میشود. در اینجا x تابع t بوده و به صورت X=f(t)نشان داده میشود. در این سریهای زمانی از میانگین متحرک به عنوان شاخصی برای بیان تحرک استفاده میشود.
فرمول: X1+X2+…+Xn/n