إختبار كاي تربيع للاستقلالية (3) حساب قيمة كاي تربيع باستخدام ميني تاب

, ,

كتبت في ماسبق عن اختبار كاي تربيع للاستقلالية (Chi-Square for independence)، و الهدف من إجراءه، أساسيات اختبار كاي تربيع للاستقلالية و أيضا قمت بتوضيح جدول التوافق (Contingency Table) و الذي يتم استخدامه لوضع متغيرين في جدول قبل إجراء الاختبار.

في هذا الموضوع، استمرارا لسلسلة مواضيع هذا الاختبار الإحصائي المفيد، سأشرح طريقة حساب قيمة P-Value و التي يتم استخدامها في اختبار كاي تربيع للاستقلالية باستخدام برنامج Minitab، و هو أحد البرامج الإحصائية الرائدة.قبل أن أبدئ بشرح طريقة حساب قيمة P-Value، أودّ أن أوضّح للقارئ الكريم بأنه و قبل حساب قيمة الـP-Value، لابد أن يتم حساب قيم تسمى القيم المتوقعة (Expected Values)، بحيث يكون هناك قيمة متوقعة لكل خلية من خلايا جدول التوافق. لكن، بسبب أننا سنقوم بإستخدام برنامج كمبيوتر (Minitab في هذه الحالة)، فلن أتطرّق لطريقة حساب القيم المتوقعة لخلايا الجدول يدويا بحكم أنه سيتم حسابها من قبل البرنامج الإحصائي تلقائيا و بشكل سريع يختصر لك الوقت.

المهم لنا في هذا الموضوع (كما سيظهر من خلال الشرح)، أن نراقب القيم المتوقعة و التي يتم حسابها من قبل البرنامج الإحصائي. لماذا؟ تابع الموضوع لتعرف السبب.

الآن، لنستكمل من حيث توقفنا في الموضوع السابق، حيث كنت قد تحدثت عن جدول التوافق (Contingency Table) الموضح في الصورة التالية:

جدول التوافق في لاختبار كاي تربيع للاستقلالية

جدول التوافق لاختبار كاي تربيع للاستقلالية

و لتذكير القارئ الكريم، نوضّح بأن الأرقام الموضحة في الجدول ذات الخلفية البيضاء (تسمى Observed) مأخوذة من طريقة جمع البيانات التي استخدمت في الدراسة (في هذه الحالة استبيان)، حيث تم تمثيل اجابات المشاركين و المشاركات في الاستبيان و المتعلقة بالسؤالين الذين نود أن ندرس العلاقة بينهما في الجدول، مع العلم بأن وضع السؤال في الأعلى أو إلى الجانب لا يفرق إنما المهم مراعاة نقل أرقام الإجابات بشكل صحيح. و لفهم الجدول بشكل أكبر راجع موضوع جدول التوافق (Contingency Table).

الآن، و قد تم تمثيل البيانات المتعلقة بالسؤالين في جدول التوافق (Contingency Table)، يمكننا البدء في حساب قيمة P-Value الخاصة بالاختبار و التي ستوضح إذا ما كان هنالك علاقة أم لا بين المتغيرين.

حساب قيمة P-Value في اختبار كاي تربيع للاستقلالية باستخدام برنامج Minitab

قم بفتح برنامج Minitab لديك حيث ستظهر لك واجهة البرنامج و هي شبيهة ببرنامج Excel، و قم بنسخ القيم (ليس الإجمالي!) الموجودة في جدول التوافق الخاص بك أو إدخالها يدويا بنفس الترتيب في البرنامج. في الجدول السابق القيم الخاصة بالحالة لها خلفية بيضاء.

Minitabالآن، كل ما تبقى هو الوصول إلى الخيار الخاص بحساب قيمة P-Value للاختبار و التي سيتم حسابها تلقائيا. لتطبيق الإختبار، إتبع الخطوات التالية:

    • من قائمة البرنامج العلوية إنتقل إلى Stat ثم Tables ثم قم باختيار Chi-Square Test Two Way Table in Worksheet

Minitab

    • بعد الضغط على الاختبار كما هو موضح أعلاه، ستظهر لنا نافذة تطلب تحديد الأعمدة المحتوية على القيم التي نود حساب قيمة الاختبار لها.

Minitab

    • قم بتحديد الأعمدة التي توجد بها القيم و ذلك بالضغط على اسم العمود و الضغط على Select حتى يتم اختيار جميع القيم. يمكنك أيضا الضغط مرتين على قيمة العمود لتضاف مباشرة.

Minitab

    • الآن، كل شئ جاهز، قم بالضغط على OK ليبدء البرنامج في حساب قيمة P-Value
    • ستظهر لك الآن الحسابات التي يجريها البرنامج إلى أن يتم عرض قيمة P-Value في الأخير

Minitab

  • في حالة عدم وجود أي تحذيرات أو تنبيهات من قبل البرنامج بجانب قيمة P-Value (كالموضحة بالأحمر في الصورة أعلاه)، فهذا يدل على أن القيمة التي لديك صحيحة إن شاء الله، و يمكنك التوقف عند هذه النقطة و استخدام قيمة P-Value التي لديك للاستنتاج من وجود علاقة من عدمها. أما إذا كنت غير متأكد أو في حالة وجود عبارات تحذيرية أو تنبيهيه بخصوص قيمة P-Value (كالموجودة في الصورة أعلاه)، لابد أن تكمل القراءة!

قيمة P-Value في الاختبار و التحذيرات

في بعض الحالات ستكون القيمة التي ستظهر لك في هذه المرحلة و المسماة P-Value صحيحة، لكن، في حالات أخرى، ستظهر لك بعض القيم التي تم حسابها من قبل البرنامج و أسفل من قيمة P-Value ستجد عبارة تحذير بالشكل التالي:

WARNING: 6 cells with expected counts less than 1. Chi-Square approximation
probably invalid.
12 cells with expected counts less than 5.

هذا يدل على أنه في القيم التي استخدمتها في الاختبار عندما أراد البرنامج أن يحسب لها قيمها المتوقعة، كان هناك بعض الملاحظات و التي لابد أن تقوم بتصحيحها!. بعض الحالات التي قد تسبب وجود مثل هذه التنبيهات هي صغر عينة الدراسة (عدد الأشخاص المشاركين في الاستبيان مثلا) و بالتالي، تكون القيم في الجدول صغيرة أو قريبة من الصفر.
لا يمكنك نهائيا استخدام قيمة P-Value في حال كان هنالك تنبيه أو تحذير كالمذكور أعلاه أو ماشابهه إلا في حالة كانت القيم المتوقعة الأقل من 5 أقل من 20% من عدد خلايا الجدول (موضّح أدناه)، و ذلك لأنه لابد من تطبيق المزيد من الخطوات للحصول على النتيجة الصحيحة

لنفهم الخطوات التي علينا تطبيقها، لابد أولا أن نفهم بعض الأمور:
أولا: قبل حساب قيمة P-Value، لابد أن يقوم البرنامج بحساب قيمة متوقعة (Expected Value) لكل قيمة في الجدول و هي الموضحة في الصورة التالية المأخوذة من تقرير الاختبار أو مساحة عرض النتائج (Session) و التي قام بحسابها البرنامج.
Minitab
توضيح للقيم في الصورة:

  • الأرقام من 1-5 إلى اليسار ذات الخلفية الزرقاء ليس لها اي علاقة بالنتائج فهي مجرد أرقام للصفوف لذا تجاهل وجودها.
  • الأرقام ذات الخلفية الصفراء هي الأرقام التي أدخلناها في برنامج Minitab و هي القيم التي تؤخذ من جدول التوافق و تسمى بـ مرّات المشاهدة (Observed).
  • النص ذو الخلفية الخضراء في أعلى الصورة يوضح لنا بأن القيم المتوقعة لكل رقم موضحة أسفل الرقم نفسه. إذا الأرقام ذات الخلفية الخضراء هي القيم المتوقعة للأرقام ذات الخلفية الصفراء و البرنامج يقوم بحسابها و لا تحتاج لمعرفة طريقة الحساب في هذه الحالة لاستخدامنا للبرامج الإحصائية.

بالرجوع إلى موضوع التنبيه الذي أظهره البرنامج
في حال كانت هنالك قيم متوقعة (ذات الخلفية الخضراء) أقل من 5، هذا سيتسبب في إيجاد خلل في الاختبار. لذلك، و للحصول على نتيجة دقيقة للاختبار، من المفترض أن عدد الخلايا التي فيها قيمة متوقعة أقل من 5 يكون 20% كحد أقصى من عدد خلايا الجدول. لذلك بالنظر إلى عدد الخلايا التي أخذناها من جدول التوافق و أدخلناها إلى البرنامج الإحصائي، كان عدد الأعمدة 5 و عدد الصفوف 5، و بالتالي، المجموع هو 25 خلية. 20% من 25 خلية هو 6 خلايا (تجاهل الكسور). لذلك، إن كان عدد الخلايا التي فيها قيم متوقعة أقل من 5 أكثر من 20% من عدد الخلايا (6 خلايا في هذه الحالة) لابد بأن نقوم بخطوات إضافية كما ذكرت لتصحيح الوضع و للحصول على نتيجة صحيحة من الاختبار. أما إذا كنت محظوظا بكون عدد الخلايا أقل من 20%، يمكنك التوقف عند هذه النقطة و استخدام قيمة P-Value التي لديك!

سأشرح في موضوع قادم إن شاء الله الخطوات التي لابد من إتباعها للحصول على نتيجة صحيحة من الاختبار في حالة وجود عدد كبير من الخلايا (بالنسبة للقيم المتوقعة ذات الخلفية الخضراء)، ذات القيم أقل من 5.

تحتاج للمساعدة في اختيار موضوع البحث، استراتيجية البحث، أو اتخاذ أي من القرارات الأخرى المهمة؟
استفد من خبرائنا في البحث العلمي

(1) عدد الردود

اترك رداً

تريد المشاركة في هذا النقاش
شارك إن أردت
Feel free to contribute!

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.