آمار توصیفی با دسته بندی، خلاصه سازی و نمایش ترسیمی دادهها سروکار دارد. به مجموع روشهایی که برای سازماندهی، خلاصه کردن و توصیف اطلاعات به کار میرود، آمار توصیفی گفته میشود. زمانی که افراد با حجمی از اطلاعات کمی روبه رو هستند، باید به سازماندهی و خلاصه کردن آنها بپردازند. به گونهای که معنی دار و قابل درک باشند و تمامی نکات پنهان در اطلاعات را آشکار کنند.
بعد از آن میتوان به سراغ آزمونهای آماری بروند. در آمار توصیفی برای این منظور، از جداول، نمودارها، میانه، میانگین، واریانس و … استفاده میشود. میتوان گفت برای طبقه بندی دادهها از این سه روش استفاده میشود:
- جداول
- نمودار
- محاسبهی معیارهای عددی
قواعد مرتب نمودن و تنظیم دادههای خام
تنظیم دادههای عددی در قالب جدولهای فراوانی و ترسیم نمودار آنها جزو اولین مراحل در تجزیه آماری است. قرار است در ادامه اصول و قواعد تنظیم و مرتب کردن دادههای خام را بررسی کنیم.
دادههای پیوسته و گسسته
این دو دسته از داده در تقابل با هم هستند. دادههای پیوسته در ریاضیات و آمار، دادههایی هستند که میتوانند بی نهایت مقدار در بین اعداد صحیح داشته باشند. کمیتی که با دادههای پیوسته نمایش داده میشود با دقت کامل اندازه گیری نمیشود. برخی از این کمیتها سرعت اتومبیل، قد افراد، وزن سیبهای یک درخت، زمانی که برای انجام یک کار معین صرف میشود و… هستند.
دادههای گسسته قابل طبقه بندی در گروههای مجزا هستند و فقط میتوانند مقادیر محدودی را داشته باشند. به عنوان مثال تعداد ساکنین یک شهر یا کشور، تعداد گلهای سفید و قرمز در یک باغچه از نمونه دادههای گسسته هستند.
دسته بندی دادهها
در آمار توصیفی و تجزیه آماری، دادهها براساس داشتن یا نداشتن یک مشخصه و ویژگی مورد مطالعه و دسته بندی قرار میگیرند. به عنوان مثال یک صفت را در نظر بگیرید مانند باسواد بودن یا نبودن. در این مثال میتوان دسته بندی دادهها را به این گونه در نظر گرفت:
- مردان باسواد
- مردان بی سواد
- زنان باسواد
- زنان بی سواد
توزیع فراوانی
در علوم آمار، اقتصاد و علوم تجربی، خلاصه سازی پرسودی که از دادهها تهیه میشود را توزیع فراوانی میگویند. مشاهدات و دادهها طبقه بندی شده و فراوانی آنها بر حسب هر طبقه توصیف میشود. در واقع برای تجزیه و تحلیل دادهها نیاز است که دادهها با یک نظم منطقی طبقه بندی شوند تا بتوان به درستی آنها را تفسر کرد. یکی از راههای این طبقه بندی استفاده از جداول توزیع فراوانی است.
وارد کردن دادهها در جدول فراوانی میتواند به صورت صعودی یا نزولی باشد. تشکیل این جدول برای توضیح روشنتر داده است، به همین دلیل باید منظم، مختصر و تعداد ردیفها محدود باشد. معمولا بسته به کل داده و مشاهدات، تعداد ردیفهایی که در نظر گرفته میشود 5 تا است.
توزیع فروانی به عنوان یک روش جمع آوری دادهها در حوزههای فنی و آماری یک روش بنیادی برای بررسی دادهها است.
اصطلاحات مربوط به جدول توزیع فراونی
حدود دستهها یا حدود کلاسها
این دو اصطلاح در واقع همان فاصله حد پایینی و حد بالایی واقعی بین طبقهها است. حد واقعی طبقه طوری تعیین میشود که هر عدد به راحتی به یک طبقه اختصاص داشته باشد. به فاصلهی بین دادههایی که در یک ردیف طبقه بندی شدهاند دامنه طبقه گفته میشود. دامنه طبقهها میتوانند مساوی یا نامساوی باشند. معمولا عرض دسته یا همان حدود دستهها را به طور تقریبی 10/1 تا 20/1 تفاوت بزرگترین و کوچکترین اندازه در نظر میگیرند.
دامنه تغییرات دادهها
دامنه تغییرات در توزیع فراوانی به اختلاف بزرگترین و کوچکترین حد واقعی دادهها گفته میشود. با R نمایش داده میشود.
R=(Max-Min)+1
حد متوسط طبقه و تعداد طبقه
با بدست آوردن حد بالایی واقعی و حد پایینی واقعی هر طبقه، حد متوسط هر طبقه (xc) بدست میآید. تعداد طبقات (k) از فرمول زیر بدست میآید.
K=R/i
فراوانی نسبی
فراوانی نسبی نشان دهنده میزان فضایی است که فراوانی یک طبقه نسبت به سایر طبقهها به خود اختصاص داده است. آن را با pf نشان میدهند.
نمودار فراوانی
نمایش هندسی دادههای جدول توزیع فراوانی را، نمودار فراوانی میگویند. نمودارها، روشهای مختلف نمایش توزیع فراوانی هستند که تصویر روشنتری از دادههای جمع آوری شده را نشان میدهند. در این نمودارها و در محورهای مختصات، دادههای آزمایش در طول محور x و فروانیها در عرض محور y نمایش داده میشوند. در آمار توصیفی، نمودارهای فراوانی چند نوع هستند که مهمترین آنها عبارتاند از:
- بافت نگار
- نمودار ستونی
- نمودار چندبر
- نمودار چندبر تجمعی
- نمودار چندبر هموار
- نمودار دایرهای
- سریهای زمانی
برای آشنایی با نمودارهای آماری دو مقاله در وب سایت آمار برتر آماده شده است. برای آشنایی با آنها روی لینکهای زیر کلیک کنید.
نمودار آماری چیست؟ انواع نمودار و کاربردهای آنها
معرفی نمودارهای آماری (قسمت دوم)
فراوانی تجمعی
فراوانی تجمعی یا فراوانی تراکمی به فراوانی هر داده به اضافهی فراوانی کلیه دادههای ماقبل گفته میشود. برای بدست آوردن فراونی تجمعی در جدول فراوانی از دومین طبقه یا داده شروع میکنند. فراوانی مطلق آن با فراوانی طبقه اول جمع میشود. مجموع این فراوانیها در طبقه دوم نوشته میشود.
در طبقه سوم، فراوانی ساده آن با فراونی تجمعی طبقه دوم جمع شده و نوشته میشود. طبق همین روش تا طبقه آخر باید پیش رفت. در نهایت فراوانی تجمعی آخرین طبقه که با مجموع کل فراوانیهای مطلق طبقهها برابر است، بدست میآید.
فراوانی تجمعی بدست آمده از این روش را صعودی میگویند. این فراوانی نشان میدهد، چه تعداد از مشاهدات مساوی یا کمتر از یک داده یا رقم موردنظر است.
درصد
مفهوم دیگری از فراوانی نسبی را با شاخص آماری درصد نشان میدهند. درصد، نسبت فراوانی یک یا تعداد معینی مشاهده (f) به تعداد کل مشاهدات (n) بر مبنای عدد 100 است. در بیان دادهها به صورت درصد، عدد 100 مبنای مقایسه قرار میگیرد.
P=f/n*100
یکی از سادهترین و مرسومترین شاخصهای آماری، درصد است. اما زمانی که تعداد کل مشاهدات یا دادهها کم باشد، نمیتوان درصد را شاخص معتبری در نظر گرفت.
پاسخ به چند سوال
چرا از آمار توصیفی در پایان نامه استفاده میشود؟
در انجام پایان نامه برای خلاصه سازی و طبقه بندی دادهها به کمک جدول، نمودار و معیارهای عددی از آن استفاده می شود.
در spss برای محاسبه آمار توصیفی از چه فرمانی استفاده میشود؟
برای تشکیل جداول فراوانی و توافقی و معیارهای عددی از فرمان Descriptive Statistics در نرم افزار اس پی اس اس استفاده میکنند.
نمودارهای کمی در آمار توصیفی کدام هستند؟
این نمودارها شامل هیستوگرام، چندبر، شاخه و برگ، جعبه ای و … میباشند.
نمودارهای وصفی کدام هستند؟
ستونی یا میلهای، دایرهای، پارتو، خطی و …
معیارهای عددی،مرکزی، پراکندگی و شکلی در آمار توصیفی کدام هستند؟
- معیارهای عددی ، معیارهای مرکزی، پراکندگی و معیارهای شکل هستند
- معیارهای مرکزی، نما، میانه، میانگین و چندکها هستند.
- معیارهای پراکندگی واریانس و انحراف معیار، ضریب تغییرات و نمرات استاندارد هستند.
- معیارهای شکلی چولگی و کشیدگی هستند.