"Institute of Educational Policy" Books
γ) Διακύμανση (s2)
Ένας άλλος τρόπος για να υπολογίσουμε τη διασπορά των παρατηρήσεων [pic] μιας μεταβλητής Χ θα ήταν να αφαιρέσουμε τη μέση τιμή [pic] από κάθε παρατήρηση και να βρούμε τον αριθμητικό μέσο των διαφορών αυτών, δηλαδή τον αριθμό: [pic]. Ο αριθμός όμως αυτός είναι ίσος με μηδέν, αφού [pic]. Γι' αυτό, ως ένα μέτρο διασποράς παίρνουμε τον μέσο όρο των τετραγώνων των αποκλίσεων των [pic] από τη μέση τιμή τους [pic]. Το μέτρο αυτό καλείται διακύμανση ή διασπορά (variance) και ορίζεται από τη σχέση (1) [pic] Ο τύπος αυτός αποδεικνύεται ότι μπορεί να πάρει την ισοδύναμη μορφή: (2) [pic] η οποία διευκολύνει σημαντικά τους υπολογισμούς κυρίως όταν η μέση τιμή [pic] δεν είναι ακέραιος αριθμός. Όταν έχουμε πίνακα συχνοτήτων ή ομαδοποιημένα δεδομένα, η διακύμανση ορίζεται από τη σχέση: (3) [pic] ή την ισοδύναμη μορφή: (4) [pic] όπου [pic] οι τιμές της μεταβλητής (ή τα κέντρα των κλάσεων) με αντίστοιχες συχνότητες [pic]. Για παράδειγμα, η διακύμανση της βαθμολογίας των μαθητών του τμήματος Α είναι σύμφωνα με την (1) [pic], ενώ για τους μαθητές του τμήματος Β βρίσκουμε [pic], που επιβεβαιώνει τη διαπίστωσή μας ότι η βαθμολογία των μαθητών του τμήματος Β παρουσιάζει μεγαλύτερη μεταβλητότητα από τη βαθμολογία των μαθητών του τμήματος Α. Ομοίως, η διακύμανση του ύψους των μαθητών για τα ομαδοποιημένα δεδομένα του πίνακα 9, υπολογίζεται σύμφωνα με τον τύπο (3), όπως φαίνεται στον επόμενο πίνακα:
|Κλάσεις |Κεντρικές τιμές |Συχνότητα | | | | | | | |[pic]|[pic] |[pic] | |[ - | |[pic] | | | | |) |[pic] | | | | | |156-16|159 | 2 |25281| 318 | | |2 |165 |8 | |1320 |50562 | |162-16|171 |12 |27225|2052 |217800| |8 |177 |11 | |1942 | | |168-17|183 |5 |29241|915 |350892| |4 |189 |2 | |378 | | |174-18| | |31329| |344619| |0 | | | | | | |180-18| | |33489| |167445| |6 | | | | | | |186-19| | |35721| |71442 | |2 | | | | | | | |[pic] |( |[pic] |[pic] | |Σύνολο: | | | | |
Επομένως: [pic] Εάν υπολογίσουμε τη διακύμανση από τα μη ομαδοποιημένα δεδομένα του πίνακα 8, βρίσκουμε [pic]. Η διαφορά αυτή οφείλεται στην απώλεια πληροφορίας λόγω ομαδοποίησης των παρατηρήσεων.