Διδακτικά Βιβλία του Παιδαγωγικού Ινστιτούτου

Αναζήτηση

Βρες
Εμφάνιση

Παράσταση χαρακτήρων

Εκτός από αριθμούς, θέλουμε να παραστήσουμε στον υπολογιστή και σύμβολα, όπως είναι τα γράμματα, τα σημεία στίξης, τα αριθμητικά ψηφία. Αυτά τα σύμβολα ονομάζονται χαρακτήρες (characters). Όπως οι αριθμοί και όλες οι άλλες πληροφορίες, έτσι και οι χαρακτήρες παριστάνονται στους υπολογιστές σαν μία σειρά από δυαδικά ψηφία.

Κάθε χαρακτήρας αντιστοιχίζεται σε μία σειρά ψηφίων που έχει μήκος συνήθως 8 ή 16 bits. Ένα κείμενο παριστάνεται με την ακολουθία των χαρακτήρων που το αποτελούν.

Η παράσταση των αριθμών με δυαδικά ψηφία είναι πολύ απλή και «αυτονόητη». Με τους χαρακτήρες όμως δε συμβαίνει το ίδιο. Η αντιστοίχιση χαρακτήρων με ακολουθίες από δυαδικά ψηφία μπορεί να γίνει με πάρα πολλούς τρόπους· έτσι για να μπορούν οι υπολογιστές να χρησιμοποιούν από κοινού δεδομένα πρέπει να συμφωνούν στην αντιστοίχιση αυτή.

Αν ένας υπολογιστής Y1 παριστάνει το γράμμα «Α» με την ακολουθία των δυαδικών ψηφίων 00110100, και ένας υπολογιστής Υ2 παριστάνει με την ακολουθία αυτή το γράμμα «Ε», τότε όταν ο Y1 στείλει ένα κείμενο στον Υ2, όλα τα «Α» στο κείμενο θα ερμηνεύονται σαν «Ε»!

Μία κοινώς αποδεκτή αντιστοίχιση χαρακτήρων-δυαδικών ακολουθιών ονομάζεται σύνολο χαρακτήρων (character set) και συνήθως είναι καθορισμένη από κάποιο διεθνή οργανισμό προτυποποίησης.

Για ευκολία, επειδή μία ακολουθία δυαδικών ψηφίων ερμηνεύεται πολύ εύκολα σαν ένας δυαδικός αριθμός, το σύνολο χαρακτήρων αναφέρεται σαν αντιστοιχία χαρακτήρων με αριθμούς.

Αν το γράμμα «Α» παριστάνεται με τη δυαδική ακολουθία 01000001, που σαν δυαδικός αριθμός έχει την τιμή 65, λέμε ότι το γράμμα «Α» παριστάνεται με τον αριθμό 65.

Ένα από τα πρώτα σύνολα χαρακτήρων είναι το ASCII (American Standard Code for Information Interchange), το οποίο στην αρχή παρίστανε τους χαρακτήρες με 7 bits και περιλάμβανε μόνο το λατινικό αλφάβητο. Το 8° bit χρησιμοποιούνταν ως bit ισοτιμίας (parity bit) που δήλωνε το πλήθος των bits του με την τιμή 1: αν το πλήθος ήταν περιττό, τότε το 8° bit ήταν 1, αλλιώς ήταν 0. Το bit ισοτιμίας χρησίμευε στην ανίχνευση λαθών κατά τη μετάδοση δεδομένων.

Ο χαρακτήρας 0110101 (2) έχει άρτιο πλήθος bits με την τιμή 1, έτσι το bit ισοτιμίας του είναι Ο, και η τελική του μορφή είναι 00110101.

Ο χαρακτήρας 1001111(2) έχει περιττό πλήθος bits με την τιμή 1, έτσι το bit ισοτιμίας του είναι 1, και η τελική του μορφή είναι 11001111.

Αργότερα το πρότυπο ASCII επεκτάθηκε στα 8 bits για να περιλάβει και άλλους χαρακτήρες (π.χ. χαρακτήρες με διακριτικά).

Οι πρώτοι 32 χαρακτήρες του προτύπου ASCII, με τιμές 0-31 είναι «μη εκτυπώσιμοι» (non printable) και χρησιμοποιούνται σαν μηνύματα ελέγχου για οθόνες, εκτυπωτές κλπ.

Ο χαρακτήρας 10 δηλώνει την αλλαγή γραμμής σε μία οθόνη τερματικού, ενώ ο χαρακτήρας 12 δηλώνει το τέλος σελίδας σε μία εκτύπωση.

Για την Ελληνική γλώσσα χρησιμοποιούμε συνήθως μία παραλλαγή του ASCII που έχει μήκος 8 bits και έχει προτυποποιηθεί από τον Ελληνικό Οργανισμό Τυποποίησης με το όνομα ΕΛΟΤ-928. Τα γράμματα του Ελληνικού αλφαβήτου παριστάνονται με τιμές που έχουν 1 στο αριστερότερο bit (δηλαδή τιμές μεγαλύτερες από 127).

Ας δούμε τις πιο ενδιαφέρουσες αντιστοιχίσεις χαρακτήρων-αριθμών από το πρότυπο ΕΛΟΤ-928: [pic]