Scoring validity

Εγκυρότητα βαθμολόγησης. Τσομπάνογλου 2007:18. Τσοπάνογλου 20102:17-20.

Η εγκυρότητα βαθμολόγησης εξαρτάται από το κατά πόσο τα αποτελέσματα ενός τεστ βασίζονται σε κατάλληλα κριτήρια, παρουσιάζουν ομοιογένεια στη βαθμολόγησή τους, είναι απαλλαγμένα όσο το δυνατόν περισσότερο από προβλήματα μέτρησης, είναι σταθερά μέσα στο χρόνο, συνεπή ως προς την επιλογή του δείγματος και εμπνέουν εμπιστοσύνη ως αξιόπιστοι δείκτες λήψης αποφάσεων (Shaw & Weir 2007:6). Ο όρος «εγκυρότητα βαθμολόγησης» είναι ευρύς: καλύπτει όλες τις πλευρές της αξιοπιστίας (Weir 2005:22-23) και μετριέται κυρίως μέσω των τεχνικών ελέγχου της ενδοβαθμολογικής και της διαβαθμολογικής αξιοπιστίας.

Η εγκυρότητα βαθμολόγησης ασχολείται με όλες τις πλευρές της διαδικασίας μέτρησης της επίδοσης ή της γλωσσικής επάρκειας οι οποίες μπορούν να επηρεάσουν τη βαθμολογία (Shaw & Weir 2007:143-146).

Υπάρχουν συγκεκριμένες παράμετροι της εγκυρότητας βαθμολόγησης. Η πρώτη αφορά τα κριτήρια και τον τύπο της κλίμακας βαθμολόγησης. Σύμφωνα με τον McNamara (1996), η κλίμακα η οποία χρησιμοποιείται για τη βαθμολόγηση ενός τεστ αντιπροσωπεύει τη θεωρητική βάση του τεστ, αντικατοπτρίζει δηλαδή την άποψη του κατασκευαστή του για το ποιες ικανότητες μετρούνται από το τεστ. Τέσσερις διαφορετικές πηγές διαφοροποίησης μεταξύ των εξεταστών έχουν εντοπιστεί από τον McNamara: Πρώτο, δύο εξεταστές μπορεί να διαφέρουν μεταξύ τους ως προς το βαθμό επιείκειας. Δεύτερο, μερικοί εξεταστές μπορεί να είναι προκατειλημμένοι απέναντι σε ομάδες εξεταζομένων ή απέναντι σε δραστηριότητες. Κάποιοι εξεταστές δηλαδή μπορεί να είναι πολύ αυστηροί σε μερικές δραστηριότητες αλλά επιεικείς σε άλλες. Επίσης κάποιοι εξεταστές μπορεί να αξιολογούν με πολύ υψηλή ή πολύ χαμηλή βαθμολογία συγκεκριμένες ομάδες εξεταζομένων. Τρίτο, οι εξεταστές μπορεί να παρουσιάζουν ασυνεπή συμπεριφορά στη βαθμολόγησή τους, δηλαδή να υπάρχουν τυχαία λάθη στον τρόπο που βαθμολογούν. Τέταρτο, οι εξεταστές μπορεί να διαφέρουν μεταξύ τους στον τρόπο που καταλαβαίνουν και εφαρμόζουν την κλίμακα αξιολόγησης, για παράδειγμα, μερικοί να βάζουν βαθμούς κοντά στο μέσο όρο, ενώ άλλοι να κινούνται στα άκρα.

Τέλος, ο ρόλος των συνθηκών υπό τις οποίες γίνεται η βαθμολόγηση (από πλευράς χρόνου, σωματικής ή ψυχολογικής κατάστασης) θεωρείται όλο και σημαντικότερος στη βαθμολόγηση, και για αυτό το λόγο πρέπει να τυποποιηθούν (McNamara 1996).

Βιβλιογραφία

  • Τσομπάνογλου Μ. (2007). Πρότυπο αξιολόγησης της εγκυρότητας δομής συστημάτων πιστοποίησης γλωσσομάθειας. Εφαρμογή του στο Κρατικό Πιστοποιητικό Γλωσσομάθειας του Επιπέδου Β2 της Αγγλικής Γλώσσας. Διδακτορική διατριβή. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης.

  • Τσοπάνογλου Α. (20102). Μεθοδολογία της επιστημονικής έρευνας και εφαρμογές της στην αξιολόγηση της γλωσσικής κατάρτιση. Θεσσαλονίκη: Εκδ. Ζήτη.


  • McNamara T. (1996). Measuring Second Language Performance. England: Longman.
  • Shaw S. D., Weir C. J. (2007). Examining Writing: Research and Practice in Assessing Second Language Writing. Cambridge: Cambridge University Press.
  • Weir C. J. (2005). Language Testing and Validation: An evidence-based Approach. Great Britain: Palgrave Macmillan.