Testlet

Δοκιμασία.

Στην αγγλική γλώσσα δεν υπήρχε ως πρόσφατα ένας ικανοποιητικός όρος ακριβώς αντίστοιχος του όρου «δοκιμασία». Ο ευρύτερα χρησιμοποιούμενος όρος ήταν το «exercise», το οποίο, όμως, ταιριάζει προφανώς για να κάνει κανείς αναφορά σε μια δραστηριότητα που γίνεται στην τάξη κατά τη διδασκαλία, αλλά δεν είναι ικανοποιητικός, όταν θέλει να κάνει κανείς αναφορά σε τμήμα ενός τεστ στη φάση της αξιολόγησης. Έτσι, τα τελευταία χρόνια έχει εμφανιστεί ο όρος «testlet» (Wainer et al. 2007, Li 2012:7), που σε ελληνικά δημοσιεύματα χρησιμοποιείται σπάνια και μένει αμετάφραστος.

Στο κείμενο Council of Europe 2003 (Manual Revision - proofread - FINAL, προσβάσιμο στην ιστοσελίδα του Συμβουλίου της Ευρώπης), στη σελίδα 50 δηλώνεται «As with the rating of spoken and written samples, it is a good idea to proceed with 4-6 items, or two or three testlets (a text with more than one item).» και στη σελίδα 79 διαβάζει κανείς «With a reading test, where several questions (items) are asked about a single text (=testlet), it is advisable to ...».Από τον ορισμό συνάγεται ότι το testlet είναι μια δοκιμασία που περιλαμβάνει κλειστές ερωτήσεις πάνω σε ένα μόνο ενιαίο κείμενο. Ο ορισμός είναι ακόμη σαφέστερος στο δημοσίευμα του Rijmen (2009:1): «It is not uncommon for a standardized test to consist of item bundles or testlets (Bradlow, Wainer, & Wang, 1999): clusters of items that are based on a common stimulus. For example, in a reading comprehension test, a reading passage is often used as the stem for more than one item». Τέλος, στο δημοσίευμα του Yao (2008:4) διαβάζει κανείς: «Measuring more complex behavior is often accomplished in many standardized educational tests through groups of multiple choice items based on a common stimulus (Wainer and Wang, 2000). Items grouped by common stimulus are called testlet. Because the information used to answer these items is interrelated in the passage, testlet items are not independent». Συνεπώς, testlet είναι η δοκιμασία που περιλαμβάνει ερωτήσεις ή ερωτήματα που σχετίζονται μεταξύ τους, δηλαδή δε βρέθηκαν τυχαία μαζί. Και για αυτό το λόγο είναι απαραίτητο, κατά την ανάλυση ερωτημάτων, να εφαρμόζονται ειδικά μοντέλα της θεωρίας απόκρισης ερωτήματος.

Ακολουθεί ένας πίνακας που εμφανίζει τους διάφορους όρους που χρησιμοποιούνται στην αγγλική και στην ελληνική για να κάνει κανείς αναφορά σε όργανα μέτρησης της επίδοσης των μαθητών:

Επίπεδο Ανάλυσης

Αγγλική

Ελληνική

Σχόλια

1. Το χαμηλότερο

(Τest) item

*Ερώτημα

Ερώτηση

Ζητούμενο

Item

1) Οι αστερίσκοι δηλώνουν τους όρους που προτείνεται από τους συντάκτες του λεξικού να χρησιμοποιούνται. Στο δεύτερο επίπεδο ο όρος «καθήκον» προτείνεται μόνο για τις περιπτώσεις άμεσης αξιολόγησης.
2) Σπάνια, τα επίπεδα 1 και 2 μπορεί να ταυτίζονται: π.χ. «Γράψτε μίαν έκθεση με θέμα 'Ο καλύτερός μου φίλος'».

2.

Testlet

Activity

Exercise

Task

*Δοκιμασία

Δοκίμιο

Θέμα

Δραστηριότητα

Άσκηση

*Καθήκον

3.

Module

Paper

Sub-test

Part

*Ενότητα

Φάση

3) Συνήθως σε κάθε ενότητα ελέγχεται μία μακροδεξιότητα. Όταν σε μια εξέταση ελέγχεται μία μόνο μακροδεξιότητα, τα επίπεδα 3 και 4 ταυτίζονται.

4) Ο όρος «test battery» θα μπορούσε να μπει σε ένα πέμπτο επίπεδο, αφού συχνά αναφέρεται σε περισσότερα του ενός τεστ, διαφορετικών αντικειμένων.

4. Το υψηλότερο

Test

Test battery

Όργανο μέτρησης Θέματα εξέτασης

*Τεστ

Εξετάσεις

Βιβλιογραφία

  • Council of Europe (2003). Manual Revision – proofread – FINAL [on line]. Available: http://www.coe.int/t/dg4/linguistic [08/12/03].
  • Li Y. (2012). Applying Multidimensional Item Response Theory Models in Validating Test Dimensionality: An Example of K–12 Large-scale Science Assessment. Journal of Applied Testing Technology, 13/2: 1-27.
  • Rijmen F. (2009). Three Multidimensional Models for Testlet-Based Tests: Formal Relations and an Empirical Comparison. Princeton: ETS.
  • Wainer H., Bradlow E. T., Wang X. (2007). Teslet Response Theory and its Applications. Cambridge: Cambridge University Press. 
  • Yao Ch. R. (2008). Application of Testlet-Effect Models to Scaling Performance Assessments of Mixed Item Types with Multiple-Criteria Scoring Rubrics. Paper presented at the annual meetings of the National Council on Measurement in Education. March 23-27 2008. New York. Available [on line]: http://www.bmirt.com/media/56bce7df1f426829ffff80f3ffffd523.pdf [12/05/13].