"Institute of Educational Policy" Books
α) Μέση Τιμή [pic]
Η μέση τιμή ενός συνόλου ν παρατηρήσεων αποτελεί το σπουδαιότερο και χρησιμότερο μέτρο της Στατιστικής και ορίζεται ως το άθροισμα των παρατηρήσεων διά του πλήθους των παρατηρήσεων. Όταν σε ένα δείγμα μεγέθους ν οι παρατηρήσεις μιας μεταβλητής Χ είναι [pic], τότε η μέση τιμή συμβολίζεται με [pic] και δίνεται από τη σχέση: (1) [pic] όπου το σύμβολο [pic] παριστάνει μια συντομογραφία του αθροίσματος [pic] και διαβάζεται "άθροισμα των [pic] από [pic] έως ν". Συχνά, όταν δεν υπάρχει πρόβλημα σύγχυσης, συμβολίζεται και ως [pic] ή ακόμα πιο απλά με [pic]. Σε μια κατανομή συχνοτήτων, αν [pic] είναι οι τιμές της μεταβλητής Χ με συχνότητες [pic] αντίστοιχα, η μέση τιμή ορίζεται ισοδύναμα από τη σχέση: [pic] (2) Η παραπάνω σχέση ισοδύναμα γράφεται: [pic] όπου [pic] οι σχετικές συχνότητες. Για παράδειγμα, η μέση επίδοση των μαθητών στο τμήμα Α θα είναι σύμφωνα με την (1) [pic] ή ισοδύναμα από τον αντίστοιχο πίνακα συχνοτήτων σύμφωνα με την (2).
|Βαθμός |Συχνότητα| | |[pic] | |[pic] | | |[pic] | | |13 |2 |26 | |14 |1 |14 | |15 |4 |60 | |16 |2 |32 | |18 |1 |18 | |Σύνολο |[pic] |[pic] | [pic]. Ομοίως, υπολογίζεται και η μέση επίδοση για το τμήμα Β, η οποία είναι πάλι [pic]. Επίσης, το μέσο ύψος των 40 μαθητών της Γ΄ Λυκείου του πίνακα 8, σύμφωνα με τη σχέση (1) είναι [pic]. Για ευκολότερο όμως υπολογισμό χρησιμοποιούμε τον πίνακα συχνοτήτων, όπως αυτός δίνεται παρακάτω, ομαδοποιώντας τα δεδομένα σε [pic] κλάσεις. Αν [pic]είναι το κέντρο της i κλάσης και [pic] η αντίστοιχη συχνότητα, τότε σύμφωνα με τη σχέση (2) η μέση τιμή θα είναι: [pic] Παρατηρούμε ότι οι δύο μέσες τιμές του ίδιου συνόλου δεδομένων δεν είναι ακριβώς οι ίδιες. Πού οφείλεται αυτή η, έστω και μικρή, διαφορά;
|Ύψος |Κεντρικές| | | |σε cm | |Συχνότητα | | | |τιμές ||[pic] | | |[pic] |[pic] | | |156-16|159 | 2 | 318 | |2 |165 |8 |1320 | |162-16|171 |12 |2025 | |8 |177 |11 |1947 | |168-17|183 |5 |915 | |4 |189 |2 |378 | |174-18| | | | |0 | | | | |180-18| | | | |6 | | | | |186-19| | | | |2 | | | | | |Σύνολο |[pic] |[pic]6903|
Η διαφορά αυτή οφείλεται στο γεγονός ότι κατά την ομαδοποίηση υποθέσαμε ότι οι παρατηρήσεις κάθε κλάσης είναι ομοιόμορφα κατανεμημένες και ότι οι τιμές της μεταβλητής σε κάθε κλάση εκπροσωπούνται από την αντίστοιχη κεντρική τιμή [pic]. Η υπόθεση αυτή σημαίνει απώλεια πληροφοριών για τις αρχικές τιμές. Χάνουμε λοιπόν λίγο ως προς στην ακρίβεια κερδίζουμε όμως χρόνο!