شاخص‌ های تمایل مرکزی

شاخص‌ های تمایل مرکزی یا معیارهای مرکزی در کنار پراکندگی، شاخه‌ای از آمار توصیفی است. شاخص مرکزی یک خلاصه توصیفی از یک مجموعه داده از طریق یک مقدار واحد است که مرکز توزیع داده را منعکس می‌کند. شاخص گرایش مرکزی یکی از اساسی‌ترین مفاهیم در آمار است.

این اندازه‌گیری‌ها نشان می‌دهند که بیشتر مقادیر در یک توزیع کجا می‌افتند و همچنین به عنوان موقعیت مرکزی توزیع نامیده می‌شوند. در آمار سه معیار رایج برای گرایش مرکزی وجود دارد که عبارتند از میانگین، میانه و مد(نما). هر کدام از این معیارها، نقطه‌ی مرکزی را با استفاده از روشی متفاوت محاسبه می‌کند. انتخاب بهترین معیار گرایش مرکزی به نوع داده‌ای که دارید بستگی دارد. در اینجا قرار است این شاخص‌ها را معرفی و روش محاسبه کردن آنها را بررسی کنیم.

این شاخه از آمار توصیفی اگرچه اطلاعاتی را در مورد مقادیر فردی در مجموعه داده ارائه نمی‌کند، اما خلاصه‌ای از کل مجموعه داده را ارائه می‌دهد.

مد یا نما در آمار

تعریف مد یا نما در آمار

ساده‌ترین شاخص تمایل مرکزی، نما است که اغلب در دامنه میانی قرار دارد. مد یا نما به عنوان مقداری تعریف می‌شود که در یک مجموعه، تکرار بیشتری دارد، در واقع مقداری است که بیشتر از همه ظاهر می‌شود.

مثال: در مجموعه داده‌های 2, 4, 5, 5, 6, 7 نما برابر است با عدد 5، زیرا دو بار در مجموعه ظاهر شده است.

اگر در یک توزیع فراوانی، تنها یک عدد وجود داشته باشد که بیشترین فراوانی را دارد، توزیع را یک نمایی یا unimodal می‌نامند. اما اگر توزیعی دارای دو نما باشد آن را توزیع دونمایی یا biomodal می‌نامند. در توزیع فراوانی دونمایی اگر دو نما با هم تفاوت زیادی نداشته باشند می‌توان میانگین آنها را بدست آورد و به عنوان برآورد نمای توزیع فراوانی استفاده کرد.

دقت کنید نما یا mode یک شاخص آماری معتبر نیست. به دلیل اینکه تنها با توجه به فراوانی مشاهدات محاسبه می‌شود و کمیت در آن دخالت ندارد.

میانه شاخص‌ های تمایل مرکزی

میانه شاخص‌ های تمایل مرکزی

میانه در آمار مقدار وسط در مجموعه داده‌ها است زمانی که آنها به ترتیب مرتب شده باشند. ترتیب داده‌ها یا مشاهدات می‌تواند به ترتیب صعودی یا نزولی باشد. به بیان دیگر میانه عددی است که اعداد را از نظر تعداد به دو قسمت تقسیم می‌کند، به طوری که نیمی از اعداد کمتر و نیم دیگر اعداد بیشتر از آن باشند.

مثال: داده‌های زیر را در نظر بگیرید:

12 8 20 48 18 45 2 18 30 1 3

این داده‌‌ها را ابتدا به ترتیب صعودی مرتب می‌کنیم، چون تعداد اعداد فرد هستند، عدد ششم (18) میانه می‌باشند.

محاسبه میانه یا Median

برای محاسبه میانه ابتدا اعداد را از کوچک به بزرگ مرتب می‌کنیم. اگر تعداد داده‌ها یا همان اعداد فرد بود عدد وسط به عنوان میانه در نظر گرفته می‌شود. اگر تعداد اعداد زوج بود میانگین دو عدد وسط را به عنوان میانه انتخاب می‌کنیم.

انواع میانگین در آمار

انواع میانگین در آمار

میانگین یکی از شاخص‌ های تمایل مرکزی و برآیند یا مرکز ثقل داده‌ها است. برای محاسبه آن، کافیست مقادیر تمام عبارت‌ها را جمع کرده و بر تعداد آنها تقسیم کنیم. میانگین برای داده‌های کمّی قابل استفاده است. استفاده از میانگین و خواص آن، در تجزیه و تحلیل آماری بسیار مفید است. به دلیل اینکه در محاسبه آن تمامی داده‌ها دخالت دارند. این شاخص تمایل مرکزی دارای انواع مختلفی است که عبارتند از میانگین حسابی، هندسی، هارمونیک یا همساز، متحرک و هموزن. در تعین نوع میانگینی که قرار است استفاده شود نوع داده‌ها اهمیت دارند.

میانگین حسابی (Arithmetic Mean)

وقتی همه مقادیر با هم جمع می‌شوند و بر تعداد آنها تقسیم می‌شود، آن را میانگین حسابی می‌نمایند.اگر میانگین را با حرف X، داده‌ها را x و تعداد کل داده‌ها را با N نشان دهیم.

طبق فرمول روبه رو می‌توان آن را محاسبه کرد:  X=ΣX/N

میانگین مرکب (Combined mean)

به میانگین گیری از تعدادی میانگین گفته می‌شود. برای محاسبه میانگین مرکب دو مجموعه از فرمول زیر استفاده می‌شود:

XT=n1X1+n2X2 / n1+n2

میانگین وزنی (Weighted Mean)

در این میانگین گیری، به جای اینکه داده‌ها به طور مساوی به میانگین نهایی کمک کنند، برخی از داده‌ها نسبت به سایر داده‎‌ها ارزش یا وزن بیشتری دارند. اگر وزن تمامی آنها برابر باشد، میانگین وزنی برابر است با میانگین حسابی. این نوع میانگین در آمار به ویژه هنگام مطالعه‌ی جمعیت‌ها بسیار رایج است.

فرمول محاسبه‌ی میانگین وزنی:

میانگین وزنی (Weighted Mean)

W = میانگین وزنی

n = تعداد عبارت هایی که باید میانگین آنها حساب شود

Wi= وزن های اعمال شده به مقادیر x

Xi= مقادیر داده به طور میانگین

میانگین هندسی (Geometric Mean)

از میانگین هندسی زمانی استفاده می‌شود که مشاهدات حاصل از بررسی به صورت درصد، نسبت و داده‌های مشابه با این موارد هستند.

فرمول محاسبه: GM = GM = 

در عمل برای محاسبه میانگین هندسی، از فرمول بالا استفاده می‌شود و سپس با آنتی لگاریتم میانگین را به دست می‌آورند. به همبن دلیل به آن میانگین لگاریتمی هم گفته می‌شود.

میانگین هارمونیک (Harmonic mean)

اغلب برای محاسبه‌ی میانگین نسبت‌ها یا نرخ‌ها استفاده می‌شود. زمانی کاربرد دارد که ارزش داده‌ها متفاوت است. برای مثال در متغیر سرعت که نسبت مسافت به زمان است یا قیمت که نسبت پول به کالا است، ارزش داده‌ها می‌تواند متفاوت باشد.

برای محاسبه میانگیم همساز یا هارمونیک باید مقادیر xها معکوس و سپس میانگین داده‌های عکس شده را محاسبه کرد. در نهایت عدد بدست آمده را معکوس نمود. میتوان ابن گونه گفت زمانی که مخرج کسر ثایت باشد از میانگین حسابی استفاده می‌شود و زمانی که صورت کسر ثابت و لی مخرج متغیر است میانگیم همساز کاربرد دارد.

فرمول محاسبه : n / (∑1/x_i)

n : تعداد مقادیر موجود در یک مجموعه داده

میانگین متحرک (moving averages)

در مواردی که داده‌ها به صورت سری‌های زمانی (هفتگی، ماهانه، سالیانه) هستند. برای مثال دما، میزان بارندگی و میزان رشد گیاه در دوره‌های زمانی معین را در نظر بگیرید. در آمار یک سری زمانی با مقادیر مختلف متغیر x در زمان‌های t تعریف می‌شود. در اینجا x تابع t بوده و به صورت X=f(t)نشان داده می‌شود. در این سری‌های زمانی از میانگین متحرک به عنوان شاخصی برای بیان تحرک استفاده می‌شود.

فرمول: X1+X2+…+Xn/n

فهرست