في معظم الدراسات الإستقصائية غالبا ما يحاول الباحث أن يربط بين المتغيرات والعوامل المؤثرة على تلك المتغيرات، كالربط بين انخفاط النشاط الإجتماعي وارتفاع معدل استخدام التكنولوجيا الحديثة. وبالتالي، فإنه يجب إثبات أن العلاقة بين تلك المتغيرات تتغير بشكل نمطي (Systematic) و ليس بشكل عشوائي (Random).

يستخدم هذا الإختبار في إثبات ما اذا كانت العلاقة بين المتغيرات علاقة نمطية أم عشوائية.

الفرض الأساسي (null hypothesis) في هذا الإختبار أن العلاقة عشوائية.

يتم قياس صحة فرضية الإختبار عن طريق (p-value)، فكلما اقتربت من الواحد الصحيح كان هذا دليلاً على عدم وجود أدلة كافية ضد الفرضية الأساسية للإختبار (null hypothesis).

مثال: يمكن استخدام هذا الاختبار لتحديد ما اذا كان تعاطي المضاد الوقائي للإنفلونزا له علاقة بتقليل عدد المصابين بالمرض أم ليس له تأثير.

يستخدم هذا الإختبار لتحديد عدد العينات اللازم لرفض الفرضية الأساسية للأختبار (null hypothesis) عند مستوى ثقة معين و ذلك عن طريق اختيار وتحديد العامل الإحصائي تحت الإختبار المطلوب.

فمثلاً، يمكن استخدام هذا الإختبار لتحديد عدد العينات اللازم لحساب القيمة المتوسطة لقيم تتغير في المدى من 100 إلى 102، و في هذه الحالة فإن العامل الإحصائي تحت الإختبار هو الإنحراف المعياري. ففي هذا المثال، بفرض أن الإنحراف المعياري 5، يستلزم حوالي 52 عينة حتى يمكن وصف النتائج للقيم التي تقع في المدى المذكور.

يستخدم هذا الإختبار للتحقق من طبيعية التوزيع الإحصائي للنتائج بمعلومية التباين (variance) لها عند مستوى ثقة معين.

هذا وتتم مقارنة التباين الحقيقي للنتائج مع التباين النظري للنتائج لتحديد إذا ما كان الإختلاف بينهم في الحدود المسموح بها إحصائيا.

في هذا الإختبار، الفرض الأساسي (null hypothesis) هو أن التوزيع الإحصائي للنتائج طبيعي (normal distribution).

يتم قياس صحة فرضية الإختبار عن طريق (p-value)، فكلما اقتربت من الواحد الصحيح كان هذا دليلاً على عدم وجود أدلة كافية ضد الفرضية الأساسية للإختبار (null hypothesis).

يستخدم هذا الإختبار في مقارنة مجموعات النتائح وتحديد ما اذا كانت لها نفس التوزيع الإحصائي تقريبا أم لا.

يعتمد هذا الإختبار على مقارنة القيمة الوسطى (median) لكل مجموعمة ويعتمد على ترتيب النتائج بشكل تصاعدي لتحديد الرتبة لكل نتيجة.

اختبار كروسكال–والليز يفترض أن النتائج كلها لها نفس التوزيع الإحصائي المستمر (continuous distribution) و لكن عوامل الموقع (location parameters) لكل مجموعة قد تختلف وأن النتائج مستقلة ولا تعتمد على بعضها.

يتم قياس صحة فرضية الإختبار عن طريق (p-value)، كما يتم عرض التمثيل الصتدوقي (Box-plot) لمقارنة القيمة الوسطى و التوزيع الإحصائي بشكل تمثيلي لنتائج المجموعات.

من التمثيل أعلاه، يشير الخط الأحمر في كل مجموعة الى القيمة الوسطى (يجب أن يتوسط هذا الخط الشكل أذا كان التوزيع الاحصائي طبيعيا)، بينما يُرمز الى النقاط الشاذة بعلامة + في كل مجموعة.

يستخدم هذا الإختبار اذا كانت المقارنة تتم بين أكثر من مجموعة للنتائج حيث يسهل تمثيلهم بيانيا و المقارنة بين التوزيع الإحصائي لهم.

في هذا الاختبار يتم دراسة مدى العلاقة بين متغيرين و تأثير مؤثر خارجي على تلك العلاقة.

مثال: لنفرض أنه على الباحث أن يسجل النتائج المعملية بين المتغير (x) والمتغير (y). و لكن تسجيل هذه النتائج كان يتم على مدار ثلاثة أيام. و في اليوم الأول، تم تثبيت درجة الحرارة عند (T1) واليوم الثاني عند (T2) واليوم الثالث عند (T3) حيث يمكن وضع النتائج في جدول كالتالي:

وبالتالي يمكن تمثيل النتائج كما هو موضح بالشكل التالي:

يستخدم هذا الاختبار لدراسة تأثير المؤثر الخارجي (درجة الحرارة) على العلاقة بين المتغيرين (x) و (y). حيث يتم تقسيم النتائج (x,y) الى مجموعات (ثلاثة مجموعات في المثال السابق) ويتم محاولة تمثيل كل مجموعة من النتائج بنموذج نظري من النماذج النظرية الأتية:

أ‌. نموذج تمثيل جميع نتائج المجموعات بالقيمة المتوسطة لها

هذا النموذج يعتبر أن نتائج جميع المجموعات هي قيمة واحدة لا تتغير إلا في حدود الخطأ الطبيعي. وبالتالي فانه يمكن تمثيل النتائج كلها بقيمة واحدة فقط. أي أن المتغير التابع (y) لا يتغير بتغير المستقل (x) ولا يتأثر بالمؤثر الخارجي (T).

في هذا المثال يتضح أن هذا النموذج النظري لا يناسب تمثيل النتائج حيث أنه من الواضح أن المتغير التابع (y) يتغير بتغير (x) و بالتالي لا يمكن تمثيل النتائج بقيمة واحد.


ب‌. نموذج تمثيل نتائج المجموعات بالقيمة المتوسطة لكل مجموعة

في هذا النموذج يتم اعتبار أن كل مجموعة من النتائج مستقلة عن المجموعة الأخرى نتيجة للمؤثر الخارجي. وبالتالي، يمكن ثمثيل كل مجموعة بقيمتها المتوسطة. أي أن المتغير (y) لا يتغير بتغير المتغير المستقل (x) ولكنه يتأثر بالمؤثر الخارجي (T).

في هذا المثال يتضح أن هذا النموذج النظري لا يناسب تمثيل النتائج حيث انه من الواضح أن المتغير التابع (y) لكل مجموعة يتغير بتغير (x) وبالتالي، لا يمكن تمثيل نتائج المجموعة الواحدة بقيمة المتوسط لها.


ج. النموذج الخطي الواحد

في هذا النموذج يتم اعتبار أن العلاقة بين المتغير التابع (y) و المتغير المستقل (x) علاقة خطية و ان المؤثر الخارجي ليس له تأثير على العلاقة بينهما. وبالتالي، فإنه يمكن تمثيل النتائج بمعادلة خطية واحدة تعبر عن نتائج المجموعات كلها.

من الممكن اعتبار أن هذا النموذج يمثل نتائج المجوعات كلها بشكل صحيح الى حد كبير حيث يمثل الخط المستقيم جميع النتائج تقريبا.


د. النموذج ذات الخطوط المتوازية

في هذا النموذج يتم اعتبار أن العلاقة بين المتغير التابع (y) والمتغير المستقل (x) علاقة خطية وأن المؤثر الخارجي له تأثير يتغير بشكل نمطي (زيادة أو نقصان) لكل مجموعة بحيث أن كل مجموعة يتم تمثيلها بمعادلة خطية لها نفس الميل. و بالتالي، فإن الخطوط المستقيمة الممثلة للمجموعات المختلفة تكون متوازية.

يمكن أيضًا افتراض صحة هذا النموذج حيث يعبر عن تمثيل النتائج بشكل ما.


هـ. النموذج ذات الخطوط المختلفة

هذا النموذج مثل نموذج الخطوط المتوازية و لكن دون فرضية أن المؤثر الخارجي يؤثر في النتائج بشكل نمطي. لذلك فإن كل مجموعة من النتائج يتم تمثيلها بمعادلة خطية بميل مختلف. وبالتالي، ليس شرطًا أن الخطوط تكون متوازية.

في هذا الاختبار يتم تمثيل نتائج المجموعات المختلفة (كنتائج العينات أو نتائج أجهزة متعددة أو نتائج تمت تحت ظروف بيئية محتلفة …الخ) باستخدام القيمة المتوسطة لكل مجموعة مع المدى الإحصائي المسموح به للتغيّر لكل مجموعة كما هو مبين في الرسم التوضيحي.

لاحظ أنه كلما تقاطعت حدود تغيّر النتائج كما هو الحال مع المجموعة رقم 5 مع المجموعات 2 و 3 و 4، كان هذا دليلا على أن نتائج تلك المجموعات متقاربة إحصائيا. وعلى الجانب الأخر، عندما لا تتقاطع حدود متغيرات النتائج، كما هو الحال بين المجموعة رقم 5 والمجموعة رقم 1، كان هذا دليلا على أن نتائج تلك المجموعتين مختلفتين إحصائيا.

يستخدم هذا الاختبار للتأكد من تطابق نتائج الأجهزة المختلفة أو من تجانس العينات المستخدمة في القياس أو تطابق نتائج المجموعات المختلفة من النتائج التي تم تسجيلها عند ظروف بيئية مختلفة.

هذا الاختبار مماثل لاختبار مقارنة متوسطات مجموعات النتائج إلا أنه يتم التعبير عن النتيجة النهائية بشكل رقمي بدلا من الشكل التمثيلي.

في هذا الاختبار، تكون الفرضية الأساسية أن النتائج ليس فيها اختلاف، أو بمعنى أخر، أن النتائج متطابقة من وجهة النظر الإحصائية.

يتم قياس مدى صحة الفرضية عن طريق قيمة الإحتمالية (p-value)، فكلما اقتربت هذة القيمة من الواحد الصحيح (p-value>0.05)، كان هذا دليلا على أنه لا توجد أدلة ضد الفرضية الأساسية أو بمعنى أخر أنه لا يمكن رفض الفرضية الأساسية.

يفترض اختبار الإنحدار الخطي (Linear regression) أن النتائج مستقلة و غير معتمدة على بعضها البعض. يُستخدم هذا الإختبار لتحديد صحة الفرضية أن نتائج المتبقي (residual) من اختبار الإنحدار الخطي مستقلة وغير مترابطة.

الفرضية الأساسية لهذا الإختبار أن النتائج مستقلة و لا تعتمد على بعضها. يتم قياس صحة فرضية الإختبار عن طريق (p-value)، بحيث كلما اقتربت القيمة الى الواحد الصحيح كان هذا دليلاً على عدم وجود أدلة كافية ضد فرضية الإختبار الأساسية (null hypothesis).

في بعض الإحصائيات، يتم تقسيم النتائج و إدراجها تحت فئات (Categories) مختلفة كعمل إحصائية مثلاً عن معدل شرب السجائر بين الشباب وتقسيمه وادراج النتائج تحت فئتين: الرجال والنساء.

يُستخدم هذا الإختبار لتحديد مدى صحة الفرض أن النتائج لا تتبع الفئات المعينة (مثلا ان شرب السجائر لا علاقة له بتقسيم الفئات حسب الجنس إلى رجال ونساء).

الفرضية الأساسية لهذا الإختبار ان النتائج مستقلة و لا تعتمد على تقسيمها الى فئات مختلفة .يتم قياس صحة فرضية الاختبار عن طريق (p-value)، بحيث كلما اقتربت القيمة الى الواحد الصحيح كان هذا دليلاً على عدم وجود أدلة كافية ضد فرضية الإختبار الأساسية (null hypothesis).