Διδακτικά Βιβλία του Παιδαγωγικού Ινστιτούτου

Αναζήτηση

Βρες
Εμφάνιση

Ομαδοποίηση των Παρατηρήσεων

Οι πίνακες συχνοτήτων και κατ’ αναλογίαν τα αντίστοιχα διαγράμματα είναι δύσκολο να κατασκευαστούν, όταν το πλήθος των τιμών μιας μεταβλητής είναι αρκετά μεγάλο. Αυτό μπορεί να συμβεί είτε στην περίπτωση μιας διακριτής μεταβλητής είτε, πολύ περισσότερο, στην περίπτωση μιας συνεχούς μεταβλητής, όπου αυτή μπορεί να πάρει οποιαδήποτε τιμή στο διάστημα ορισμού της. Σ’ αυτές τις περιπτώσεις είναι απαραίτητο να ταξινομηθούν (ομαδοποιηθούν) τα δεδομένα σε μικρό πλήθος ομάδων, που ονομάζονται και κλάσεις (class intervals), έτσι ώστε κάθε τιμή να ανήκει μόνο σε μία κλάση. Τα άκρα των κλάσεων καλούνται όρια των κλάσεων (class boundaries). Συνήθως υιοθετούμε την περίπτωση που μια κλάση περιέχει το κάτω άκρο της (κλειστή αριστερά) αλλά όχι το άνω άκρο της (ανοικτή δεξιά), δηλαδή που οι κλάσεις είναι της μορφής [ , ). Οι παρατηρήσεις κάθε κλάσης θεωρούνται όμοιες, οπότε μπορούν να "αντιπροσωπευθούν" από τις κεντρικές τιμές, τα κέντρα δηλαδή κάθε κλάσης. - Το πρώτο βήμα στην ομαδοποίηση των δεδομένων είναι η εκλογή του αριθμού κ των ομάδων ή κλάσεων. Ο αριθμός αυτός συνήθως ορίζεται αυθαίρετα από τον ερευνητή σύμφωνα με την πείρα του. Γενικά όμως μπορεί να χρησιμοποιηθεί ως οδηγός ο παρακάτω πίνακας:

|Μέγεθος |Αριθμός |Μέγεθος |Αριθμός | |δείγματος |κλάσεων |δείγματος |κλάσεων | |ν |κ |ν |κ | | |5 |[pic] |9 | |[pic] |6 |[pic] |10 | |[pic] |7 |[pic] |11 | |[pic] |8 |[pic] |12 | |[pic] | | | |

- Το δεύτερο βήμα είναι ο προσδιορισμός του πλάτους των κλάσεων. Πλάτος μιας κλάσης ονομάζεται η διαφορά του κατωτέρου από το ανώτερο όριο της κλάσης. Στην πλειονότητα των πρακτικών εφαρμογών οι κλάσεις έχουν το ίδιο πλάτος. Φυσικά υπάρχουν και περιπτώσεις όπου επιβάλλεται οι κλάσεις να έχουν άνισο πλάτος, όπως, για παράδειγμα, στις κατανομές εισοδήματος, ημερών απεργίας κτλ. Για να κατασκευάσουμε ισοπλατείς κλάσεις, χρησιμοποιούμε το εύρος (range) R του δείγματος, δηλαδή τη διαφορά της μικρότερης παρατήρησης από τη μεγαλύτερη παρατήρηση του συνολικού δείγματος. Τότε υπολογίζουμε το πλάτος c των κλάσεων διαιρώντας το εύρος R διά του αριθμού των κλάσεων κ, στρογγυλεύοντας, αν χρειαστεί για λόγους διευκόλυνσης, πάντα προς τα πάνω. Το επόμενο βήμα είναι η κατασκευή των κλάσεων. Ξεκινώντας από την μικρότερη παρατήρηση, ή για πρακτικούς λόγους λίγο πιο κάτω από την μικρότερη παρατήρηση, και προσθέτοντας κάθε φορά το πλάτος c δημιουργούμε τις κ κλάσεις. Αυτονόητο είναι ότι η μεγαλύτερη τιμή του δείγματος θα (πρέπει να) ανήκει οπωσδήποτε στην τελευταία κλάση. Τέλος, γίνεται η διαλογή των παρατηρήσεων. Το πλήθος των παρατηρήσεων [pic] που προκύπτουν από τη διαλογή για την κλάση i καλείται συχνότητα της κλάσης αυτής ή συχνότητα της κεντρικής τιμής [pic], [pic]. Έστω, για παράδειγμα, ότι από τα δεδομένα του πίνακα 4 εξετάζουμε το ύψος των μαθητών. Το ύψος των μαθητών, όπως έχει καταγραφεί με τη σειρά, δίνεται στον παρακάτω πίνακα 8.

Πίνακας 8

Το ύψος (σε cm) των μαθητών της Γ΄ Λυκείου, όπως έχει καταγραφεί στον πίνακα 4. Σε αγκύλες έχουμε τη μικρότερη και τη μεγαλύτερη τιμή.

|170 |180 |178 |165 |170 |168 |175 |175 |173 |162 | |160 |170 |167 |177 |180 |170 |182 |178 |165 |178 | |[156|175 |172 |173 |167 |187 |170 |180 |178 |[191| |] |169 |167 |166 |179 |178 |180 |164 |170 |] | |176 | | | | | | | | |173 |

Παρατηρούμε ότι το εύρος του δείγματος είναι [pic]. Επειδή έχουμε [pic] παρατηρήσεις, χρησιμοποιούμε [pic] κλάσεις. Το πλάτος των κλάσεων είναι [pic]. Αν θεωρήσουμε ως αρχή της πρώτης κλάσης το 156, θα έχουμε τον επόμενο πίνακα 9. - Πρέπει να προσεχτεί ότι: - Καμία παρατήρηση δεν μπορεί να μείνει έξω από κάποια κλάση. - Οι κεντρικές τιμές διαφέρουν μεταξύ τους όσο και το πλάτος των κλάσεων, που εδώ είναι ίσο με 6. - Μία παρατήρηση που συμπίπτει με το άνω άκρο μιας κλάσης θα τοποθετηθεί κατά τη διαλογή στην αμέσως επόμενη κλάση. Για παράδειγμα, ο μαθητής με ύψος 180 θα τοποθετηθεί στην πέμπτη κλάση [180, 186).

Πίνακας 9

Κατανομές συχνοτήτων (απόλυτων, σχετικών, αθροιστικών) για τα δεδομένα του πίνακα 8.

| |Κεντρικές | | |Σχετική| |Αθρ. | |Κλάσεις | |Διαλογή |Συχν. |Συχνότητα |Αθρ. συχν. |Σχετ. | | |τιμές | | | ||Συχν. | |[ -|[pic] | |[pic|[pic] |[pic] |[pic] | |) | | |] | | | | |156-16|159 || | | 2 | 5,0 | 2 | 5,0| |2 |165 || | | ||8 |20,0 |10 | | |162-16|171 || | | |12 |30,0 |22 |25,0 | |8 |177 || | | ||11 |27,5 |33 |55,0 | |168-17|183 || | | ||5 |12,5 |38 |82,5 | |4 |189 || | |2 |5,0 |40 |95,0 | |174-18| || | | || | | |100,0 | |0 | || | | || | | | | |180-18| || | | | | | |6 | || | | || | | | | |186-19| | | | | | | |2 | || | | | | | | | |Σύνολο |( |40 |100 |( |( |