"Institute of Educational Policy" Books

Search

Go
Show

Το πρότυπο Unicode

Επειδή οι 256 διαφορετικοί χαρακτήρες που διαθέτει το πρότυπο ASCII δεν επαρκούν για να κωδικοποιηθούν όλα τα αλφάβητα, ιδιαίτερα εκείνα που έχουν ιδεογράμματα, έχει αναπτυχθεί και το πρότυπο Unicode, το οποίο παριστάνει ένα χαρακτήρα με μία ακολουθία 16 bits. Έτσι μπορεί να παραστήσει 65536 χαρακτήρες, που είναι αρκετοί για γλώσσες όπως η Κινέζικη και η Ιαπωνική.

Οι 65536 χαρακτήρες του προτύπου Unicode έχουν διαιρεθεί σε «περιοχές», κάθε μία από τις οποίες περιέχει την κωδικοποίηση των χαρακτήρων μίας γλώσσας. Οι πρώτοι 256 χαρακτήρες, για λόγους συμβατότητας, έχουν αποδοθεί στους ίδιους χαρακτήρες με το πρότυπο ASCII.

Οι ελληνικοί χαρακτήρες στο πρότυπο Unicode βρίσκονται στην περιοχή από 880(10) έως 975(10).

Οι χαρακτήρες της Ταϊλανδέζικης γραφής βρίσκονται στην περιοχή από 3584(10) έως 3711(10).

Το μεγάλο πλεονέκτημα του προτύπου Unicode, εκτός του ότι μπορεί να στεγάσει τους χαρακτήρες όλων των συστημάτων γραφής χωρίς υπερκαλύψεις, είναι ότι μπορεί να χρησιμοποιηθεί για να κωδικοποιήσουμε ένα κείμενο που περιέχει πολλές διαφορετικές γλώσσες.

Το τρίγλωσσο κείμενο της συμφωνίας εμπορικής συνεργασίας μεταξύ Ελλάδας, Αρμενίας και Γεωργίας περιέχει τρία διαφορετικά αλφάβητα (τέσσερα αν περιέχει λέξεις ή φράσεις που είναι γραμμένες με το λατινικό αλφάβητο).

Αν το κείμενο παρασταθεί με το πρότυπο Unicode, όλα τα κείμενα θα είναι κωδικοποιημένα με τους σωστούς χαρακτήρες. Αν πρέπει να χρησιμοποιηθεί το πρότυπο ASCII, θα πρέπει να γραφτούν τρία διαφορετικά κείμενα και κάθε ένα να «διαβάζεται» με την έκδοση του προτύπου ASCII που περιλαμβάνει την αντίστοιχη γλώσσα.

Οι χαρακτήρες που θα περιέχονται σε κάθε κείμενο θα έχουν κωδικοποιήσεις με τιμές (που φαίνονται στον πίνακα):

Γλώσσα - Από - Έως Ελληνική - 880 (10) - 975 (10) Αρμενική - 1328(10) - 1423 (10) Γεωργιανή - 4256 (10) - 4351 (10)