Διδακτικά Βιβλία του Παιδαγωγικού Ινστιτούτου

Αναζήτηση

Βρες
Εμφάνιση

Ψηφιακή Παράσταση Εικόνας

Μία ψηφιακή εικόνα αποτελείται από μικρές κουκίδες που ονομάζονται εικονοστοιχεία (pixels). Στην πιο απλή περίπτωση κάθε εικονοστοιχείο μπορεί να είναι είτε άσπρο είτε μαύρο.

Στο διπλανό σχήμα βλέπουμε μία ασπρόμαυρη ψηφιακή εικόνα. Η εικόνα του σχήματος αποτελείται από 256 γραμμές και 256 στήλες, περιέχει δηλαδή 65.536 διαφορετικά εικονοστοιχεία. Επειδή η φωτογραφία είναι ασπρόμαυρη, κάθε εικονοστοιχείο κωδικοποιείται με ένα bit: το Ο συμβολίζει το μαύρο χρώμα και το 1 το άσπρο. Έτσι, για την αποθήκευση αυτής της φωτογραφίας στον υπολογιστή χρειαζόμαστε 65.536 bits ή ισοδύναμα 8.192 bytes.

Για έγχρωμες εικόνες, κάθε εικονοστοιχείο απαιτεί περισσότερα από 1 bit για την αναπαράσταση του αντίστοιχου χρώματος. Για παράδειγμα, αν έχουμε 16 διαφορετικά χρώματα και κάθε χρώμα εμφανίζει 16 αποχρώσεις, τότε χρειαζόμαστε 16x16=256 διαφορετικές τιμές. Όλες αυτές μπορούμε να τις αναπαραστήσουμε με ένα byte (8 bits). Αν, για παράδειγμα, έχουμε μια εικόνα μεγέθους 640x480, δηλαδή 307.200 εικονοστοιχεία και για καθένα χρησιμοποιούμε 3 bytes=24bit για την αναπαράσταση του χρώματος, τότε χρειαζόμαστε 921.600 bytes. Τα αρχεία που περιέχουν την εικόνα ασυμπίεστη, ονομάζονται χαρτογραφικά (bitmap, BMP).

Το μέγεθος των ασυμπίεστων εικόνων αυξάνει δραματικά με την αύξηση των διαστάσεών της ή του βάθους χρώματος (δηλ. τον αριθμό των bytes για την αναπαράσταση των διαφορετικών χρωμάτων). Η χρησιμοποίηση της μεθόδου συμπίεσης RLE σε εικόνες που είναι σκίτσα ή σχεδιαγράμματα, κυρίως με αποχρώσεις του γκρι, οδηγεί σε σημαντική μείωση του όγκου τους. Η RLE μέθοδος είναι πολύ αποτελεσματική για εικόνες με συνεχόμενες περιοχές εικονοστοιχείων που έχουν το ίδιο χρώμα, καθώς τα αντικαθιστά με ένα κωδικό και το πλήθος τους (βλέπε κεφάλαιο 2.3). Τα αρχεία αυτά είναι τα PCX αλλά και πολλές μορφές TIFF.

Η συμπίεση LZW εφαρμόζεται σε περισσότερο σύνθετες εικόνες, όπως π.χ. έγχρωμες φωτογραφίες. Εκεί, υπάρχει μεγάλη ποικιλία χρωμάτων, που όμως επαναλαμβάνονται πολλές φορές τα ίδια, άρα, όπως είδαμε στο κεφάλαιο 2.3, η κωδικοποίησή τους με λιγότερα bit φέρνει μεγάλα ποσοστά συμπίεσης. Τέτοια συμπίεση υπάρχει στα αρχεία GIF.

Τέλος, αντίθετα με τις προηγούμενες μεθόδους αναπαράστασης που χρησιμοποιούσαν μη απωλεστικούς αλγόριθμους συμπίεσης, υπάρχει μια ευρύτατα διαδεδομένη μέθοδος για εικόνες, που επιτυγχάνει συμπίεση μέχρι και 100-200 φορές σε ορισμένες περιπτώσεις, με μικρή απώλεια της ποιότητας. Η κωδικοποίηση αυτή λέγεται κωδικοποίηση JPEG (Joint Photographic Expert Group). Βασίζεται στην εφαρμογή μιας σειράς πολύπλοκων μαθηματικών μετασχηματισμών στην εικόνα. Για τη συμπίεση ή την αποσυμπίεση από JPEG χρειάζεται αρκετή υπολογιστική ισχύς, κάτι που παλαιότερα ήταν ιδιαίτερα χρονοβόρα. Σήμερα, που υπάρχουν ισχυροί επεξεργαστές, η κωδικοποίηση JPEG δεν είναι πια πρόβλημα, και έχει το πλεονέκτημα της δυνατότητας επιλογής του ποσοστού συμπίεσης που θέλουμε να επιτύχουμε, με αντίστοιχη επιβάρυνση στην ποιότητα της εικόνας. Συνήθως συμπιέσεις 10 έως και 20 φορές, οδηγούν σε εικόνες με μη ορατή διαφορά από την αρχική.

Αντίθετα με την παραπάνω μορφή ψηφιακής αναπαράστασης εικόνας όπου υπάρχει κωδικοποίηση της κάθε εικονοστοιχείου με συγκεκριμένο αριθμό bits, η διανυσματική αναπαράσταση βασίζεται στα γεωμετρικά χαρακτηριστικά των σχημάτων που απεικονίζουν την εικόνα. Έτσι αν π.χ. είχαμε να αναπαραστήσουμε ένα τρίγωνο, τότε η διανυσματική αναπαράσταση περιλαμβάνει την αποθήκευση των καρτεσιανών συντεταγμένων των τριών κορυφών. Κάθε κορυφή θεωρείται εικονοστοιχείο και αποθηκεύεται όπως πριν. Όμως τώρα έχουμε τρία σημεία που ορίζουν όλο το σχήμα. Η διανυσματική μορφή παράγεται κυρίως από προγράμματα σχεδίασης (CAD -Computer Aided Design). Ο υπολογιστής σχεδιάζει τα γεωμετρικά σχήματα με βάση τις συντεταγμένες που διαβάζει από τέτοια αρχεία