Reliability

Αξιοπιστία. Δημητρόπουλος 20057:173, 268-277. Κασσωτάκης 200110:50, 228-231.

Η αξιοπιστία αποτελεί ιδιότητα των οργάνων μέτρησης και του τρόπου χρήσης τους, συνεπώς και των τεστ που χρησιμοποιούνται για αξιολόγηση στην εκπαίδευση. Ένα τεστ κρίνεται αξιόπιστο όταν όσες φορές και αν διανεμηθεί στους εξεταζόμενους, εφόσον οι συνθήκες διεξαγωγής της εξέτασης είναι ταυτόσημες ή πανομοιότυπες και δεν έχει μεσολαβήσει μάθηση, τα αποτελέσματα που δίνει είναι ίδια ή παρόμοια (Freeman & Lewis 2004:25). Όσο πιο όμοια είναι τα αποτελέσματα, τόσο πιο αξιόπιστο θεωρείται το τεστ.

Η αξιοπιστία ενός τεστ δηλώνεται με το συντελεστή αξιοπιστίας, ο οποίος παίρνει τιμές που κυμαίνονται μεταξύ 0 και 1 (Hughes 2003:39). Όταν ο δείκτης ενός τεστ τείνει προς το 1, τότε το τεστ θεωρείται αξιόπιστο. Αντίθετα, όταν ο δείκτης πλησιάζει το 0, τότε το τεστ κρίνεται αναξιόπιστο, και άρα ακατάλληλο για χρήση χωρίς τροποποιήσεις (Hughes 2003:39).

Η αξιοπιστία ενός τεστ εξαρτάται από τα εξής (Brown 1996:188-192):

1. Αξιοπιστία που σχετίζεται με το μαθητή (student-related reliability), η οποία αναφέρεται στην ψυχολογική και σωματική κατάσταση του εξεταζόμενου. Για παράδειγμα, είναι πιθανό κατά τη διάρκεια της εξέτασης ένας εξεταζόμενος να αισθάνεται κουρασμένος, να έχει κάποιο προσωπικό πρόβλημα που δεν του επιτρέπει να αποδώσει τα μέγιστα, ή απλά να βρίσκεται σε «άσχημη μέρα».

2. Αξιοπιστία αξιολογητών (rater or scorer-related reliability), η οποία δείχνει κατά πόσο οι βαθμολογίες ενός τεστ από δύο ή περισσότερους βαθμολογητές συμπίπτουν (διαβαθμολογική αξιοπιστία). Αν διαφέρουν, αυτό μπορεί να οφείλεται στη χρήση διαφορετικών κριτήριων από τον κάθε βαθμολογητή, στην έλλειψη της απαραίτητης προσοχής κατά τη διάρκεια της διόρθωσης, στην απειρία ή στις διαφορετικές αντιλήψεις. Ωστόσο, η έλλειψη αξιοπιστίας μπορεί να οφείλεται στο χαρακτήρα ή την ψυχολογία μεμονωμένων αξιολογητών (ενδοβαθμολογική αξιοπιστία). Μέτρα για να επιτευχθεί η αξιοπιστία των αξιολογητών είναι η ανωνυμία των υποψηφίων, η χρήση περισσότερων από ένα βαθμολογητών και η εξαγωγή μέσου όρου των βαθμών.

3. Αξιοπιστία που αφορά το ίδιο το τεστ (test-related reliability) και σχετίζεται με το περιεχόμενο, τη δομή και τον τρόπο παρουσίασής του στους εξεταζόμενους. Για παράδειγμα, ένα χρονοβόρο και μεγάλο σε έκταση τεστ είναι πολύ πιθανό να κουράσει τον υποψήφιο και άρα να επηρεάσει αρνητικά την απόδοσή του.

4. Αξιοπιστία που σχετίζεται με τις συνθήκες κάτω από τις οποίες διανέμεται το τεστ (test administration reliability). Για παράδειγμα, η αξιοπιστία ενός τεστ μπορεί να μειωθεί, όταν μέσα στην αίθουσα υπάρχει θόρυβος, χαμηλός φωτισμός, αλλαγές στη θερμοκρασία, κ.ά.

Η αξιοπιστία μιας εξέτασης είναι δυνατό να αυξηθεί με διάφορους τρόπους, οι σημαντικότεροι από τους οποίους είναι οι εξής (Hughes 2003:44-47):

1. Η χρήση πολλών και διαφορετικών τρόπων εξέτασης, όπως είναι για παράδειγμα ο συνδυασμός ερωτήσεων πολλαπλής επιλογής, σύντομης απάντησης και ανοιχτών ερωτήσεων σε ένα τεστ. Μια τέτοια επιλογή ευεργετεί όλους τους μαθητές, γιατί εξαλείφει τις υποκειμενικές προτιμήσεις τους σε διαφορετικές δοκιμασίες, και άρα προσδίδει μεγαλύτερη αξιοπιστία στην εξέταση.

2. Ο αποκλεισμός των υπερβολικά εύκολων ή υπερβολικά δύσκολων ερωτήσεων, που δυσκολεύουν τη διαφοροποίηση των καλών από τους κακούς μαθητές. Είναι θεμιτό, ωστόσο, να χρησιμοποιούνται σχετικά εύκολες ερωτήσεις στην αρχή κάθε τεστ, ώστε να μειώνεται το άγχος και να ενθαρρύνεται ο μαθητής.

3. Η μείωση της ελευθερίας του μαθητή, κάτι που συνεπάγεται τη δημιουργία συγκροτημένων δοκιμασιών που δεν επιτρέπουν μεγάλα περιθώρια επιλογής θεμάτων από τους μαθητές.

4. Η δημιουργία ξεκάθαρων και σαφών ερωτήσεων, ώστε να αποφεύγεται η σύγχυση του μαθητή ή απαντήσεις που δεν έχουν προβλεφθεί από τον εξεταστή.

5. Η εξοικείωση των μαθητών με τη διάταξη και τη μορφή των δοκιμασιών στις οποίες πρόκειται να εξεταστούν.

6. Η διενέργεια της εξέτασης σε συνθήκες που δεν επηρεάζουν την απόδοση εξεταζόμενων (π.χ. μέγεθος αίθουσας, φωτισμός, θόρυβος).

Τέλος, είναι σημαντικό να αναφερθεί πως όταν η αξιοπιστία δε συνοδεύεται από την εγκυρότητα μιας εξέτασης, τότε από μόνη της δεν επαρκεί (Weir 1993:21). Συνεπώς, ένα τεστ έχει σημασία μόνο όταν οι δύο αυτές έννοιες συνυπάρχουν.

Βιβλιογραφία

  • Δημητρόπουλος Ε. (20057). Η εκπαιδευτική αξιολόγηση: Η αξιολόγηση του μαθητή. Μέρος Δεύτερο. Αθήνα: Εκδ. Γρηγόρη.

  • Κασσωτάκης Μ. (200110). Η Αξιολόγηση της επιδόσεως των μαθητών: Μέσα, Μέθοδοι, προ­βλή­ματα, προοπτικές. Αθήνα: Εκδ. Γρηγόρη.


  • Brown J. D. (1996). Testing in Language Programs. New York: Prentice Hall.
  • Freeman R., Lewis R. (2004). Planning and Implementing Assessment. London: Routledge Falmer.
  • Hughes A (2003). Testing for Language Teachers. Cambridge: Cambridge University Press.

  • Weir C. J. (1993). Understanding and Developing Language Tests. United Kingdom: Prentice Hall International.