آزمون کای اسکوئر چه چیزی به شما میگوید؟
دو نوع اصلی از Chi-Square وجود دارد: آزمون independence یا آزمون عدم وابستگی که یک سوال از رابطه را مطرح میکند مثلا “آیا بین جنسیت دانش آموزان و انتخاب رشته ارتباطی وجود دارد؟” و دیگری آزمون goodness-of-fit یا آزمون نیکوئی برازش است، معمولاً تفاوت بین مقادیر مشاهده شده و مقادیر مورد انتظار در مدل بررسی شونده را خلاصه سازی میکند.
Independence یا عدم وابستگی
هنگام در نظر گرفتن جنسیت دانش آموز و انتخاب رشته، می توان از آزمون کای اسکوئر برای عدم وابستگی یا استقلال استفاده کرد. برای انجام این آزمون، محقق دادههای مربوط به دو متغیر انتخابی (جنس و دروس انتخابی) را جمعآوری میکند و سپس فراوانیهایی را که دانشآموزان دختر و پسر در بین کلاسهای پیشنهادی انتخاب میکنند با استفاده از فرمول بالا و جدول آماری χ2 مقایسه میکند.
اگر هیچ رابطهای بین جنسیت و انتخاب رشته وجود نداشته باشد (یعنی اگر مستقل باشند)، باید انتظار داشت که فرکانسهای واقعی که در آن دانش آموزان دختر و پسر هر درس ارائه شده را انتخاب میکنند تقریباً برابر باشد یا از سوی دیگر، نسبت مردان و زنان دانشجو در هر دوره انتخابی باید تقریباً برابر با نسبت دانشجویان زن و مرد در نمونه باشند.
Goodness-of-Fit یا آزمون نیکوئی
χ2 راهی برای آزمایش اینکه چگونه نمونه ای از دادهها از لحاظ ویژگیهای معلوم یا فرضی با جمعیت بزرگتری که نمونه برای نمایش آن در نظر گرفته شده است مطابقت دارد، ارائه میدهد. اگر داده های نمونه با ویژگیهای مورد انتظار جامعه مورد علاقه ما مطابقت نداشته باشد، نمیخواهیم از این نمونه برای نتیجه گیری در مورد جمعیت بزرگتر استفاده کنیم.
چه زمان از آزمون کای اسکوئر استفاده میشود؟
اگر آزمایشی فقط دو صورت ممکن داشته باشد (مثل پسر و دختر بودن فرزند) متغیر مرتبط دارای توزیع دو جمله ای است. در این حالت میتوان از توزیع نرمال برای آزمون وجود تفاوت معنادار بین فراوانیهای مشاهده شده و فراوانیهای مورد انتظار استفاده کرد. اما زمانی که بیش از دو واقعه رخ دهد، دیگر نمیتوان از توزیع نرمال برای آزمون تفاوت معنادار بین این فراوانیها استفاده کرد. برای آزمون این فرض که آیا فراوانیهای مشاهده شده (یک واقعهی اتفاق افتاده) با فراوانیهایی که بر مبنای اصول و مبانی تئوری مورد انتظار هستند، اختلاف معناداری را دارا هستند یا خیر، از کای اسکوئر استفاده میشود. لازم به ذکر است که در مواردی که دو حالت وقوع و عدم وقوع وجود دارد نیز میتوان از آزمون χ2 استفاده کرد ولی به طوری که گفته خواهد شد باید تصحیح لازم انجام شود.
فرض کنید N داده آماری در C گروه طبقه بندی شدهاند و فراوانی مشاهده شدهی هر طبقه به ترتیب برابر با o1,o2,…,oc باشد بنابراین: Σoi=N
تصحیح ییتز (Yate’s correction)
چون در کاربرد محک آماری کای اسکوئر برای آزمون توافق بین فراوانیها، از جدول مربع کای که برمبنای متغیرهای پیوسته تنظیم شده است، برای متغیرهای کیفی (ناپیوسته) استفاده میگردد، باید به نحوی اختلاف بین متغیرها را در نظر گرفت. با استفاده از فرمول زیر (تصحیح ییتز) این اشکال برطرف میگردد:
در کای اسکوئر تصحیح شده، فقط در مواردی که درجه آزادی برابر با یک میباشد محاسبه میگردد و برای نمونههای بزرگ مقادیر کای اسکوئر تصحیح شده و تصحیح نشده بسیار نزدیک به یکدیگر میباشند. برای اطمینان بیشتر در مواردی که درجه آزادی بیشتر از 1 میباشد، میتوان حداقل برای طبقههایی که فراوانی آنها بین 5 تا 10 میباشد نیز تصحیح ییتز را محاسبه کرد.