آزمون کای اسکوئر (مربع کای)

آزمون کای اسکوئر یک آزمون آماری است که نحوه مقایسه یک مدل با داده های مشاهده شده واقعی را اندازه گیری می‌کند. داده‌هایی که در این آزمون استفاده می‌شود باید تصادفی، خام، انحصاری باشد و همچنین از متغیرهای مستقل و از نمونه‌های به اندازه کافی بزرگ، استخراج شده باشد. آزمون مربع کای اغلب در آزمون فرضیه‌ها استفاده می‌شود. اندازه‌ی هر گونه اختلاف بین نتایج مورد انتظار و نتایج واقعی را با توجه به حجم نمونه و تعداد متغیرهای موجود در رابطه مقایسه می‌کند. در این آزمون‌ها برای تعیین اینکه یک فرضیه صفر را می‌توان براساس تعداد کل متغیرها و نمونه‌های درون آزمایش رد کرد از درجات آزادی استفاده می‌شود. هر چه حجم نمونه بزرگتر باشد، نتایج قابل اعتمادتر است.

خدمات پایان نامه

محققین و دانشجوهای عزیز علاوه بر استفاده از اطلاعات آماری در وب سایت آمار برتر می توانند از خدمات دانشجویی ما از جمله انجام پایان نامه و نگارش پوروپوزال نیز استفاده کنند.

پروپوزال نویسی

آزمون کای اسکوئر چه چیزی به شما می‌گوید؟

دو نوع اصلی از Chi-Square وجود دارد: آزمون independence یا آزمون عدم وابستگی که یک سوال از رابطه را مطرح می‌کند مثلا “آیا بین جنسیت دانش آموزان و انتخاب رشته ارتباطی وجود دارد؟” و دیگری آزمون goodness-of-fit یا آزمون نیکوئی برازش است، معمولاً تفاوت بین مقادیر مشاهده شده و مقادیر مورد انتظار در مدل بررسی شونده را خلاصه سازی می‌کند.

فرمول آزمون کای اسکوئر

Independence یا عدم وابستگی

هنگام در نظر گرفتن جنسیت دانش آموز و انتخاب رشته، می توان از آزمون کای اسکوئر برای عدم وابستگی یا استقلال استفاده کرد. برای انجام این آزمون، محقق داده‌های مربوط به دو متغیر انتخابی (جنس و دروس انتخابی) را جمع‌آوری می‌کند و سپس فراوانی‌هایی را که دانش‌آموزان دختر و پسر در بین کلاس‌های پیشنهادی انتخاب می‌کنند با استفاده از فرمول بالا و جدول آماری χ2 مقایسه می‌کند.

اگر هیچ رابطه‌ای بین جنسیت و انتخاب رشته وجود نداشته باشد (یعنی اگر مستقل باشند)، باید انتظار داشت که فرکانس‌های واقعی که در آن دانش آموزان دختر و پسر هر درس ارائه شده را انتخاب می‌کنند تقریباً برابر باشد یا از سوی دیگر، نسبت مردان و زنان دانشجو در هر دوره انتخابی باید تقریباً برابر با نسبت دانشجویان زن و مرد در نمونه باشند.

Goodness-of-Fit یا آزمون نیکوئی

χ2 راهی برای آزمایش اینکه چگونه نمونه ای از داده‌ها از لحاظ ویژگی‌های معلوم یا فرضی با جمعیت بزرگتری که نمونه برای نمایش آن در نظر گرفته شده است مطابقت دارد، ارائه می‌دهد. اگر داده های نمونه با ویژگی‌های مورد انتظار جامعه مورد علاقه ما مطابقت نداشته باشد، نمی‌خواهیم از این نمونه برای نتیجه گیری در مورد جمعیت بزرگتر استفاده کنیم.

چه زمان از آزمون کای اسکوئر استفاده می‌شود؟

اگر آزمایشی فقط دو صورت ممکن داشته باشد (مثل پسر و دختر بودن فرزند) متغیر مرتبط دارای توزیع دو جمله‌ ای است. در این حالت می‌توان از توزیع نرمال برای آزمون وجود تفاوت معنادار بین فراوانی‌های مشاهده شده و فراوانی‌های مورد انتظار استفاده کرد. اما زمانی که بیش از دو واقعه رخ دهد، دیگر نمی‌توان از توزیع نرمال برای آزمون تفاوت معنادار بین این فراوانی‌ها استفاده کرد. برای آزمون این فرض که آیا فراوانی‌های مشاهده شده (یک واقعه‌ی اتفاق افتاده) با فراوانی‌هایی که بر مبنای اصول و مبانی تئوری مورد انتظار هستند، اختلاف معناداری را دارا هستند یا خیر، از کای اسکوئر استفاده می‌شود. لازم به ذکر است که در مواردی که دو حالت وقوع و عدم وقوع وجود دارد نیز می‌توان از آزمون χ2 استفاده کرد ولی به طوری که گفته خواهد شد باید تصحیح لازم انجام شود.

فرض کنید N داده آماری در C گروه طبقه بندی شده‌اند و فراوانی مشاهده شده‌ی هر طبقه به ترتیب برابر با o1,o2,…,o_c باشد بنابراین: Σoi=N

تصحیح ییتز (Yate’s correction)

چون در کاربرد محک آماری کای اسکوئر برای آزمون توافق بین فراوانی‌ها، از جدول مربع کای که برمبنای متغیرهای پیوسته تنظیم شده است، برای متغیرهای کیفی (ناپیوسته) استفاده می‌گردد، باید به نحوی اختلاف بین متغیرها را در نظر گرفت. با استفاده از فرمول زیر (تصحیح ییتز) این اشکال برطرف می‌گردد:

تصحیح ییتز

در کای اسکوئر تصحیح شده، فقط در مواردی که درجه آزادی برابر با یک می‌باشد محاسبه می‌گردد و برای نمونه‌های بزرگ مقادیر کای اسکوئر تصحیح شده و تصحیح نشده بسیار نزدیک به یکدیگر می‌باشند. برای اطمینان بیشتر در مواردی که درجه آزادی بیشتر از 1 می‌باشد، می‌توان حداقل برای طبقه‌هایی که فراوانی آنها بین 5 تا 10 می‌باشد نیز تصحیح ییتز را محاسبه کرد.