آمار توصیفی (طبقه بندی داده‌ها)

آمار توصیفی با دسته بندی، خلاصه سازی و نمایش ترسیمی داده‌ها سروکار دارد. به مجموع روش‌هایی که برای سازماندهی، خلاصه کردن و توصیف اطلاعات به کار می‌رود، آمار توصیفی گفته می‌شود. زمانی که افراد با حجمی از اطلاعات کمی روبه رو هستند، باید به سازماندهی و خلاصه کردن آنها بپردازند. به گونه‌ای که معنی دار و قابل درک باشند و تمامی نکات پنهان در اطلاعات را آشکار کنند.

بعد از آن می‌توان به سراغ آزمون‌های آماری بروند. در آمار توصیفی برای این منظور، از جداول، نمودارها، میانه، میانگین، واریانس و … استفاده می‌شود. می‌توان گفت برای طبقه بندی داده‌ها از این سه روش استفاده می‌شود:

  • جداول
  • نمودار
  • محاسبه‌ی معیارهای عددی

آمار توصیفی (طبقه بندی داده‌ها)

قواعد مرتب نمودن و تنظیم داده‌های خام

تنظیم داده‌های عددی در قالب جدول‌های فراوانی و ترسیم نمودار آنها جزو اولین مراحل در تجزیه آماری است. قرار است در ادامه اصول و قواعد تنظیم و مرتب کردن داده‌های خام را بررسی کنیم.

داده‌های پیوسته و گسسته

این دو دسته از داده در تقابل با هم هستند. داده‌های پیوسته در ریاضیات و آمار، داده‌هایی هستند که می‌توانند بی نهایت مقدار در بین اعداد صحیح داشته باشند. کمیتی که با داده‌های پیوسته نمایش داده می‌شود با دقت کامل اندازه گیری نمی‌شود. برخی از این کمیت‌ها سرعت اتومبیل، قد افراد، وزن سیب‌های یک درخت، زمانی که برای انجام یک کار معین صرف می‌شود و… هستند.

داده‌های گسسته قابل طبقه بندی در گروه‌های مجزا هستند و فقط می‌توانند مقادیر محدودی را داشته باشند. به عنوان مثال تعداد ساکنین یک شهر یا کشور، تعداد گل‌های سفید و قرمز در یک باغچه از نمونه داده‌های گسسته هستند.

دسته بندی داده‌ها

در آمار توصیفی و تجزیه آماری، داده‌ها براساس داشتن یا نداشتن یک مشخصه و ویژگی مورد مطالعه و دسته بندی قرار می‌گیرند. به عنوان مثال یک صفت را در نظر بگیرید مانند باسواد بودن یا نبودن. در این مثال می‌توان دسته بندی داده‌ها را به این گونه در نظر گرفت:

  • مردان باسواد
  • مردان بی سواد
  • زنان باسواد
  • زنان بی سواد

توزیع فراوانی

در علوم آمار، اقتصاد و علوم تجربی، خلاصه سازی پرسودی که از داده‌ها تهیه می‌شود را توزیع فراوانی می‌گویند. مشاهدات و داده‌ها طبقه بندی شده و فراوانی آنها بر حسب هر طبقه توصیف می‌شود. در واقع برای تجزیه و تحلیل داده‌ها نیاز است که داده‌ها با یک نظم منطقی طبقه بندی شوند تا بتوان به درستی آنها را تفسر کرد. یکی از راه‌های این طبقه بندی استفاده از جداول توزیع فراوانی است.

وارد کردن داده‌ها در جدول فراوانی می‌تواند به صورت صعودی یا نزولی باشد. تشکیل این جدول برای توضیح روشن‌تر داده است، به همین دلیل باید منظم، مختصر و تعداد ردیف‌ها محدود باشد. معمولا بسته به کل داده و مشاهدات، تعداد ردیف‌هایی که در نظر گرفته می‌شود 5 تا است.

توزیع فروانی به عنوان یک روش جمع آوری داده‌ها در حوزه‌های فنی و آماری یک روش بنیادی برای بررسی داده‌ها است.

اصطلاحات مربوط به جدول توزیع فراونی

حدود دسته‌ها یا حدود کلاس‌ها

این دو اصطلاح در واقع همان فاصله حد پایینی و حد بالایی واقعی بین طبقه‌ها است. حد واقعی طبقه طوری تعیین می‌شود که هر عدد به راحتی به یک طبقه اختصاص داشته باشد. به فاصله‌ی بین دادههایی که در یک ردیف طبقه بندی شده‌اند دامنه طبقه گفته می‌شود. دامنه طبقه‌ها می‌توانند مساوی یا نامساوی باشند. معمولا عرض دسته یا همان حدود دسته‌ها را به طور تقریبی 10/1 تا 20/1 تفاوت بزرگترین و کوچکترین اندازه در نظر می‌گیرند.

دامنه تغییرات داده‌ها

دامنه تغییرات در توزیع فراوانی به اختلاف بزرگترین و کوچکترین حد واقعی داده‌ها گفته می‌شود. با R نمایش داده می‌شود.

R=(Max-Min)+1

حد متوسط طبقه و تعداد طبقه

با بدست آوردن حد بالایی واقعی و حد پایینی واقعی هر طبقه، حد متوسط هر طبقه (xc) بدست می‌آید. تعداد طبقات (k) از فرمول زیر بدست می‌آید.

K=R/i

فراوانی نسبی

فراوانی نسبی

فراوانی نسبی نشان دهنده میزان فضایی است که فراوانی یک طبقه نسبت به سایر طبقه‌ها به خود اختصاص داده است. آن را با pf نشان می‌دهند.

نمودار فراوانی

نمایش هندسی داده‌های جدول توزیع فراوانی را، نمودار فراوانی می‌گویند. نمودارها، روش‌های مختلف نمایش توزیع فراوانی هستند که تصویر روشن‌تری از داده‌های جمع آوری شده را نشان می‌دهند. در این نمودارها و در محورهای مختصات، داده‌های آزمایش در طول محور x و فروانی‌ها در عرض محور y نمایش داده می‌شوند. در آمار توصیفی، نمودارهای فراوانی چند نوع هستند که مهمترین آنها عبارت‌اند از:

  • بافت نگار
  • نمودار ستونی
  • نمودار چندبر
  • نمودار چندبر تجمعی
  • نمودار چندبر هموار
  • نمودار دایره‌ای
  • سری‌های زمانی

برای آشنایی با نمودارهای آماری دو مقاله در وب سایت آمار برتر آماده شده است. برای آشنایی با آنها روی لینک‌های زیر کلیک کنید.

نمودار آماری چیست؟ انواع نمودار و کاربردهای آنها

معرفی نمودارهای آماری (قسمت دوم)

فراوانی تجمعی

فراوانی تجمعی یا فراوانی تراکمی به فراوانی هر داده به اضافه‌ی فراوانی کلیه داده‌های ماقبل گفته می‌شود. برای بدست آوردن فراونی تجمعی در جدول فراوانی از دومین طبقه یا داده شروع می‌کنند. فراوانی مطلق آن با فراوانی طبقه اول جمع می‌شود. مجموع این فراوانی‌ها در طبقه دوم نوشته می‌شود.

در طبقه سوم، فراوانی ساده آن با فراونی تجمعی طبقه دوم جمع شده و نوشته می‌شود. طبق همین روش تا طبقه آخر باید پیش رفت. در نهایت فراوانی تجمعی آخرین طبقه که با مجموع کل فراوانی‌های مطلق طبقه‌ها برابر است، بدست می‌آید.

فراوانی تجمعی بدست آمده از این روش را صعودی می‌گویند. این فراوانی نشان می‌دهد، چه تعداد از مشاهدات مساوی یا کمتر از یک داده یا رقم موردنظر است.

درصد در آمار توصیفی

درصد

مفهوم دیگری از فراوانی نسبی را با شاخص آماری درصد نشان می‌دهند. درصد، نسبت فراوانی یک یا تعداد معینی مشاهده (f) به تعداد کل مشاهدات (n) بر مبنای عدد 100 است. در بیان داده‌ها به صورت درصد، عدد 100 مبنای مقایسه قرار می‌‎گیرد.

P=f/n*100

یکی از ساده‌ترین و مرسوم‌ترین شاخص‌های آماری، درصد است. اما زمانی که تعداد کل مشاهدات یا داده‌ها کم باشد، نمی‌توان درصد را شاخص معتبری در نظر گرفت.

پاسخ به چند سوال

چرا از آمار توصیفی در پایان نامه استفاده می‌شود؟

در انجام پایان نامه برای خلاصه سازی و طبقه بندی داده‌ها به کمک جدول، نمودار و معیارهای عددی از آن استفاده می شود.

در spss برای محاسبه آمار توصیفی از چه فرمانی استفاده می‌شود؟

برای تشکیل جداول فراوانی و توافقی و معیارهای عددی از فرمان Descriptive Statistics در نرم افزار اس پی اس اس استفاده می‌کنند.

نمودارهای کمی در آمار توصیفی کدام هستند؟

این نمودارها شامل هیستوگرام، چندبر، شاخه و برگ، جعبه ای و … می‌باشند.

نمودارهای وصفی کدام هستند؟

ستونی یا میله‌ای، دایره‎‌ای، پارتو، خطی و …

معیارهای عددی،مرکزی، پراکندگی و شکلی در آمار توصیفی کدام هستند؟

  • معیارهای عددی ، معیارهای مرکزی، پراکندگی و معیارهای شکل هستند
  • معیارهای مرکزی، نما، میانه، میانگین و چندک‌ها هستند.
  • معیارهای پراکندگی واریانس و انحراف معیار، ضریب تغییرات و نمرات استاندارد هستند.
  • معیارهای شکلی چولگی و کشیدگی هستند.

فهرست