Βιβλιογραφία 

Σώματα Κειμένων 

 

Περιεχόμενα

Περιγραφή του Εθνικού Θησαυρού Ελληνικής Γλώσσας (ΕΘΕΓ).

Πρόκειται για ένα ηλεκτρονικό σώμα κειμένων (corpus) που στεγάζεται στον δικτυακό τόπο του Ινστιτούτου Επεξεργασίας Λόγου και περιλαμβάνει πάνω από 34.000.000 λέξεις, σύμφωνα με το σχετικό εισαγωγικό σημείωμα[1]. Είναι ένα «ανοιχτό» σώμα, δηλαδή μπορεί να εμπλουτίζεται συνεχώς με νέα κείμενα, κάτι που επιτρέπει η σύγχρονη ψηφιακή τεχνολογία και επιβάλλει η εξέλιξη της γλώσσας: τα είδη λόγου (genres) μεταβάλλονται διαρκώς (κυρίως αυτά που συνδέονται με νέες πρακτικές λόγου ή νέες μορφές τεχνολογίας) και αναδύονται καινούργια (όπως, για παράδειγμα, οι διαδικτυακές εφημερίδες και τα διαδικτυακά προσωπικά ημερολόγια), ενώ παράλληλα το γλωσσικό σύστημα ενσωματώνει αλλαγές που οφείλονται σε νέες χρήσεις του ή σε εξωτερικές επιρροές.

Το εν λόγω σώμα περιλαμβάνει μόνο γραπτά κείμενα. Αυτό εξηγείται από την ευκολία συλλογής και ηλεκτρονικής επεξεργασίας τους. Τα προφορικά κείμενα, ιδιαίτερα όταν είναι συνομιλιακά, παρουσιάζουν δυσκολίες ως προς την καταγραφή και τη μεταγραφή τους σε γραπτό λόγο. Μάλιστα, τα διακριτικά στοιχεία του προφορικού εκφωνήματος (ύψος, ένταση, επιτόνιση, παύσεις κ.ά.), αν αποτυπωθούν στη μεταγραμμένη του μορφή, δίνουν κείμενα σημειωτικά επιβαρυμένα, δηλαδή δυσανάγνωστα, ενώ ταυτόχρονα δυσχεραίνουν και την ψηφιακή τους εκμετάλλευση. Ωστόσο, τα σώματα αυθεντικού προφορικού λόγου είναι εντελώς απαραίτητα για τη μελέτη της γλώσσας και για διδακτικές εφαρμογές[2]. Το εισαγωγικό σημείωμα του ΕΘΕΓ αφήνει να εννοηθεί ότι σε μελλοντική επέκταση του σώματος θα περιληφθούν και προφορικά κείμενα. Μπορούμε, πάντως, να θεωρήσουμε ότι τον πρωτογενή προφορικό λόγο εκπροσωπούν στο corpus, ως έναν βαθμό, οι συνεντεύξεις, οι συνομιλίες ή οι ομιλίες[3], που όμως έχουν δημοσιευτεί σε εφημερίδες και περιοδικά με απαλοιφή των στοιχείων προφορικότητας, σαν να πρόκειται για γραπτά κείμενα.

Η αναλογικότητα της αντιπροσώπευσης των διαλεκτικών ποικιλιών (γεωγραφικών, όπως η Κρητική, η Ποντιακή κ.ά., ή κοινωνικών, όπως η «γλώσσα» των εργατών, η «γλώσσα» των γυναικών, η «γλώσσα» των νέων, οι αντι-γλώσσες περιθωριακών ομάδων κ.ά.) και των λειτουργικών ποικιλιών μιας γλώσσας (επαγγελματικών, όπως της νομικής, της ιατρικής, της πληροφορικής κ.ά., ή θεσμικών, όπως της εκπαίδευσης, του στρατού, της δημόσιας διοίκησης κ.ά.) (Halliday, 1989: 29-43) είναι το πιο βασικό κριτήριο καταρτισμού σωμάτων κειμένων.

Για να τιθασευτεί η διαλεκτική ποικιλότητα και «να αντιμετωπιστεί το πρόβλημα της διγλωσσίας», ο ΕΘΕΓ συγκροτήθηκε με χρονική αφετηρία το 1975[4], έτος καθιέρωσης της Δημοτικής ως επίσημης γλώσσας του κράτους. Αυτό σημαίνει ότι αποκλείστηκαν παλαιότερα κείμενα, λόγια ή αρχαϊστικά, που δεν συμφωνούν με την τυποποίηση της κοινής νεοελληνικής (στάνταρ ποικιλία) όπως αυτή επιβλήθηκε αρχικά με την επίσημη σχολική γραμματική και το συντακτικό, και εδραιώθηκε μέσα από τη χρήση σύγχρονων λεξικών[5]. Επίσης, αποκλείστηκαν κείμενα που περιέχουν στοιχεία από γεωγραφικές ή κοινωνικές διαλέκτους. Ωστόσο, μια τέτοια στρατηγική, που δικαιολογημένα πλειοδοτεί υπέρ της στάνταρ ποικιλίας, εγείρει μια σειρά ερωτημάτων. Γιατί δεν ανθολογούνται κείμενα (λογοτεχνικά, επιστημονικά, δοκιμιακά κ.ά.) που γράφτηκαν πριν από το 1975, τα οποία εναρμονίζονται με τη στάνταρ ποικιλία και είναι αντιπροσωπευτικά της εξέλιξης της κοινής νεοελληνικής[6]; Υπάρχουν, μετά τη μεταπολίτευση, κείμενα γεωγραφικών διαλέκτων, που έπρεπε να εξαιρεθούν από το corpus; Αν, όπως προγραμματικά δηλώνεται (Γαβριηλίδου κ.ά., 1993: 312), «το σώμα περιλαμβάνει κείμενα των οποίων το ύφος κυμαίνεται από το επίσημο / λόγιο (π.χ. Νομοθεσία) έως οικείο / φιλικό (διαφήμιση, διάλογοι)», τότε πώς είναι δυνατό να απουσιάζουν αφενός λόγια στοιχεία και αφετέρου στοιχεία κοινωνιολέκτων από τα επιλεγμένα κείμενα; Θα συνεχίσουν στο μέλλον να αποκλείονται κείμενα κοινωνικών διαλέκτων και ιδιολέκτων όπως αυτά που εμφανίζονται στο Διαδίκτυο (προσωπικές ιστοσελίδες, weblogs, SMS κ.λπ.) και φαίνεται ότι θα επηρεάσουν σημαντικά την εξέλιξη της κοινής νεοελληνικής; Εντέλει, μπορεί να γίνει διχοτομική διάκριση ανάμεσα σε κείμενα διαλεκτικά και μη, ιδιαίτερα όταν αναφερόμαστε σε μείξεις λειτουργικών ποικιλιών, όπως είναι, για παράδειγμα, η γλώσσα της λογοτεχνίας, της διαφήμισης ή της συνέντευξης; Τα ερωτήματα αυτά (και άλλα παρόμοια) υπαινίσσονται την ανάγκη συνεχούς ελέγχου, ίσως και αναθεώρησης, των κριτηρίων με τα οποία καταρτίζεται ένα σώμα κειμένων. Οι διορθωτικές κινήσεις που έγιναν στην πορεία προς τον τελικό καταρτισμό του ΕΘΕΓ δείχνει ότι οι συντελεστές του είχαν πλήρη επίγνωση της ανάγκης αυτής (Γαβριηλίδου κ.ά., 1995: 831).

Η λειτουργική ποικιλότητα της γραπτής παραγωγής της κοινής νεοελληνικής χαρτογραφείται στο corpus με τον εξής τρόπο: επιλέγονται αντιπροσωπευτικά κείμενα από τομείς εμπειρίας (συγκροτούν «υπογλώσσες», σύμφωνα με την ορολογία των συντακτών του corpus) που αντιστοιχούν σε διάφορες κοινωνικές δραστηριότητες οι οποίες σχετίζονται με την οργάνωση του δημόσιου αλλά και του ιδιωτικού χώρου, όπως είναι η δημόσια διοίκηση, η μαζική ενημέρωση και επικοινωνία, οι επιστήμες, οι τέχνες και η καθημερινή ζωή. Οι εν λόγω τομείς καλύπτουν ένα μεγάλο εύρος ζητημάτων δημόσιου και ιδιωτικού ενδιαφέροντος. Το κριτήριο αυτό της θεματικής ταξινόμησης των κειμένων διασταυρώνεται με το κριτήριο του φορέα δημοσίευσης των κειμένων (του «μέσου δημοσίευσης ή επικοινωνίας»). Αντιπροσωπεύονται όλοι οι υλικοί φορείς του γραπτού λόγου, παραδοσιακοί (βιβλίο, εφημερίδα, περιοδικό κ.ά.) και σύγχρονοι (διαδίκτυο). Τέλος, τα δύο αυτά κριτήρια συνδυάζονται με το κριτήριο των ειδών λόγου (των «κειμενικών ειδών»). Επιλέγονται, δηλαδή, ανά τομέα εμπειρίας, κείμενα που ανήκουν σε τυποποιημένες και αναγνωρίσιμες οργανωτικές δομές οι οποίες εξυπηρετούν συγκεκριμένους επικοινωνιακούς στόχους. Αξίζει να σημειωθεί ότι οι τομείς εμπειρίας υποστηρίζονται από λεπτομερή υποκατηγοριοποίηση (για παράδειγμα, ο τομέας της μαζικής ενημέρωσης περιλαμβάνει, ως πραγματώσεις ποικιλιών ύφους, όλες τις οικογένειες συμβάντων, τις ρουμπρίκες, που φιλοξενούνται σε μια εφημερίδα μεγάλης κυκλοφορίας). Το ίδιο συμβαίνει και με τα είδη λόγου, που υποκατηγοριοποιούνται ανά τομέα εμπειρίας (για παράδειγμα, ο τομέας λογοτεχνίας περιλαμβάνει μυθιστορήματα, διηγήματα, χρονογραφήματα, παραμύθια κ.ά.).

Κριτήρια ταξινόμησης των κειμενικών ειδών στον ΕΘΕΓ.

Στη συνέχεια, θα παρουσιάσουμε λεπτομερώς και θα σχολιάσουμε την ταξινόμηση των κειμένων του ΕΘΕΓ με βάση τα κριτήρια που προαναφέρθηκαν. Η τριμερής αυτή ταξινόμηση (μέσο δημοσίευσης, γένος / κειμενικό είδος, θέμα / περιεχόμενο) απηχεί τη συμφραστική ανάλυση λειτουργικών ποικιλιών (registers) όπως τυποποιήθηκε από τον Halliday (1978). Η ανάλυση αυτή στηρίζεται σε τρεις μεταβλητές: το πεδίο, τον τρόπο και το επίπεδο ύφους του λόγου. Η πρώτη μεταβλητή (πεδίο) αντιστοιχεί στη θεματική μιας κειμενικής πραγμάτωσης, η δεύτερη (τρόπος) στην υλικότητα του φορέα που διοχετεύει το κειμενικό μήνυμα και η τρίτη μεταβλητή (επίπεδο ύφους) στη σχέση των συνομιλιακών / κοινωνικών ρόλων του συντάκτη και του αναγνώστη ενός κειμένου. Οι τρεις αυτές μεταβλητές συλλήβδην καθορίζουν τη λειτουργική ποικιλία στην οποία εντάσσεται ένα κείμενο. Ωστόσο, τα κείμενα δεν μορφοποιούνται μόνο βάσει του σημασιακού δυναμικού που απορρέει από το πλαίσιο των άμεσων συμφραζομένων τους (context of situation). Χρειάζονται οργανωτικά σχήματα, δηλαδή δομές γνωσιακού τύπου που κρυσταλλώνονται μέσα από την ιστορία και τον πολιτισμό (context of culture) μιας γλωσσικής κοινότητας, και ικανοποιούν συγκεκριμένες επικοινωνιακές ανάγκες των χρηστών.

Περιγραφή και σχολιασμός των ταξινομικών αρχών του ΕΘΕΓ.

Ας επιστρέψουμε τώρα στην τριμερή ταξινόμηση των κειμένων που ανθολογούνται στον ΕΘΕΓ και τα κριτήριά της. Όσον αφορά το κριτήριο του μέσου δημοσίευσης των κειμένων, περιλαμβάνονται όλοι οι παραδοσιακοί φορείς: το βιβλίο (ως αυτόνομο κείμενο, ως συλλογικός τόμος και ως σειρά), η εφημερίδα (ημερήσια, εβδομαδιαία), το περιοδικό (εβδομαδιαίο, δεκαπενθήμερο κ.λπ.). Σε χωριστή κατηγορία (με τίτλο «αδιευκρίνιστο») στεγάζονται ηλεκτρονικά ή διαδικτυακά κείμενα και κείμενα επικοινωνίας διαφόρων μορφών (π.χ. διαφημιστικά φυλλάδια, υπηρεσιακά έγγραφα, επιστολές). Τα διαφημιστικά κείμενα (μπροσούρες, προσπέκτους, φέϊγ βολάν κ.λπ.) καθώς επίσης και τα διαδικτυακά κείμενα, τα «κυβερνοκείμενα» (ψηφιοποιημένα συμβατικά, όπως η ηλεκτρονική εφημερίδα, ή ψηφιοποιημένα πολυτροπικά, όπως οι ηλεκτρονικές ειδήσεις κ.ά.) (Shepherd & Watters, 1998) μπορούν, βεβαίως, να αντιμετωπιστούν ως συμβατικά γραπτά κείμενα. Ωστόσο, ο κώδικας της γραφής δεν είναι ο μόνος που συμμετέχει στην κατασκευή του μηνύματός τους. Από τη μια μεριά, τα γραπτά διαφημιστικά κείμενα συχνά περιλαμβάνουν εικόνες και γραφικά που «συνομιλούν» με το κείμενο της διαφήμισης. Είναι, δηλαδή, πολυτροπικά κείμενα, τα οποία, σε ορισμένες περιπτώσεις, δεν μπορούν να κατανοηθούν και να ερμηνευτούν χωρίς τον συνυπολογισμό των άλλων σημειωτικών συστημάτων που τα υποστηρίζουν. Από την άλλη μεριά, τα διαδικτυακά κείμενα, που οργανώνονται ιεραρχικά σε επάλληλες στιβάδες υπερκειμένων (hypertexts) και εκμεταλλεύονται, εκτός από τη γραφή, πολλά σημειωτικά συστήματα (εικόνα, βίντεο, ήχο, μουσική κ.ά.) είναι νέου τύπου πολυτροπικά κείμενα, άρα, διαφορετικής σημειωτικής υλικότητας από τα παραδοσιακά γραπτά κείμενα (Crowston & Williams, 1997). Πιστεύουμε, λοιπόν, ότι η κατηγορία «αδιευκρίνιστο» μπορεί να τμηθεί σε δύο υποκατηγορίες: η μία θα περιλαμβάνει μονοτροπικά γραπτά κείμενα (έγγραφα, επιστολές ή μη πολυτροπικές διαφημίσεις και κυβερνοκείμενα) ενώ η άλλη θα στεγάζει τα πολυτροπικά κείμενα κάθε είδους. Η διάκριση αυτή είναι επιβεβλημένη όχι μόνο επειδή αλλάζει το μέσο δημοσίευσης αλλά κυρίως επειδή η αλλαγή αυτή επηρεάζει αποφασιστικά την οργάνωση, τη γραφή και την ερμηνεία των πολυτροπικών κειμένων. Συνεπώς, αν οι πληροφορίες που σχετίζονται με τον φορέα του κειμένου διακρίνουν τα κείμενα σε μονοτροπικά και πολυτροπικά, διευκολύνουν ιδιαίτερα τον χρήστη στην κατανόησή τους.

Όσον αφορά το κριτήριο του θέματος / περιεχομένου, οι ταξινομικές κατηγορίες και υποκατηγορίες του corpus είναι: ασχολίες (ελεύθερος χρόνος, αυτοκίνητο, μόδα κ.λπ.), γεωγραφία (ταξίδια, ανθρωπολογία κ.λπ.), επιστήμη (μαθηματικά, αστρονομία, οικολογία κ.λπ.), επιχειρήσεις (οικονομία, διαφήμιση κ.λπ.), ιστορία (ιστορία, αρχαιολογία, βιογραφίες κ.λπ.), κοινωνία (πολιτική, νομική, κοινωνιολογία κ.λπ.), τέχνες (ανθρωπιστικά γράμματα, φιλοσοφία, θρησκεία, εικαστικά κ.λπ.), υγεία (ιατρική, ψυχολογία κ.λπ.) και αδιευκρίνιστο (κείμενα που δεν ανήκουν θεματικά στις παραπάνω κατηγορίες). Όπως είναι φανερό, πρόκειται για ευρύτατη αντιπροσώπευση των τομέων εμπειρίας του δημόσιου και ιδιωτικού χώρου, που εξασφαλίζει στον χρήστη απαραίτητες, εγκυκλοπαιδικού τύπου, πληροφορίες για την ένταξη ενός κειμένου σε μια συγκεκριμένη γνωσιακή περιοχή και τον αναγνωρισμό ενός ορισμένου τρόπου αναπαράστασης του πραγματικού. Αξίζει στο σημείο αυτό να σημειωθεί ότι, ήδη από τη δεκαετία του 60, η ανάλυση λειτουργικών ποικιλιών (Gregory, 1967) και, αργότερα, η συστημική λειτουργική γλωσσολογία, που συνέχισε και εμπλούτισε την ίδια παράδοση (Eggins, 1994: 74 / Gerot, 1995: 37-52), υπογραμμίζουν τη σημασία της διάκρισης των γνωσιακών πεδίων σε τεχνικά και μη (ειδική vs. κοινόχρηστη γνώση). Τα τεχνικά και τα μη τεχνικά πεδία αναγνωρίζονται από τα διαφορετικά λεξικογραμματικά χαρακτηριστικά τους. Η τεχνική γλώσσα είναι η γλώσσα των ειδικών όρων, των ακρώνυμων, της συντετμημένης σύνταξης, των τεχνικών ενεργειών, της περιγραφικής κατηγόρησης, ενώ η καθημερινή γλώσσα είναι η γλώσσα του κοινόχρηστου λεξιλογίου, των πλήρων ονομάτων, της στάνταρ σύνταξης και της αξιολογικής κατηγόρησης (Eggins, όπ. παραπ.). Η αδρομερής αυτή ομαδοποίηση των γνωσιακών πεδίων και η συσχέτισή της με γλωσσικά χαρακτηριστικά πιστεύουμε ότι είναι συμβατή με τη θεματική ταξινόμηση των κειμένων του ΕΘΕΓ (για παράδειγμα, τεχνικά είναι τα περισσότερα επιστημονικά κείμενα, ενώ μη τεχνικά είναι τα περισσότερα κείμενα της κατηγορίας «ασχολίες», τα ταξιδιωτικά της κατηγορίας «γεωγραφία», η διαφήμιση της κατηγορίας «επιχειρήσεις» κ.λπ.) και μπορεί να προσφέρει στον χρήστη, πέρα από τις πληροφορίες περιεχομένου, χρήσιμες πληροφορίες ή ενδείξεις για το γλωσσικό προφίλ των κειμένων ανάλογα με τον τομέα εμπειρίας στον οποίο εντάσσονται.

Στον ΕΘΕΓ δεν έχει γίνει ταξινόμηση των κειμένων με βάση το επίπεδο ύφους. Σύμφωνα με τη συμφραστική ανάλυση λειτουργικών ποικιλιών, στην οποία έχουμε αναφερθεί προηγουμένως, το επίπεδο ύφους είναι η μεταβλητή που αναφέρεται στη σχέση του παραγωγού ενός κειμένου και του ερμηνευτή του, όταν αντιμετωπίζονται ως συνομιλιακοί / κοινωνικοί ρόλοι. Η σχέση αυτή βρίσκει την κειμενολογική αποτύπωσή της σε ένα συνεχές με ακρότατα την άτυπη και την τυπική γλώσσα. H άτυπη γλώσσα χαρακτηρίζεται από λεξιλόγιο θετικών / αρνητικών στάσεων, καθημερινό λεξιλόγιο, γλωσσική αγένεια, διακοπές, επικαλύψεις, χρήση βαφτιστικών ονομάτων και υποκοριστικών κ.λπ. Αντίθετα, η τυπική γλώσσα χαρακτηρίζεται από ουδέτερο ή γραφειοκρατικό λεξιλόγιο, γλωσσική ευγένεια, προσεκτική διαδοχή συνεισφορών, χρήση τίτλων και όχι ονομάτων κ.λπ. Με άλλα λόγια, η άτυπη γλώσσα στηρίζει αυτό που οι κοινωνιογλωσσολόγοι ονομάζουν «χαμηλή ποικιλία» (πρβλ. τον 'περιορισμένο κώδικα' του Bernstein) ενώ η τυπική γλώσσα στηρίζει την «υψηλή ποικιλία» (πρβλ. τον 'επεξεργασμένο κώδικα' του Bernstein). Θα μπορούσε κανείς να έχει βάσιμες επιφυλάξεις για το αν μπορούν να ταξινομηθούν κείμενα με βάσει το κριτήριο 'άτυπη / τυπική γλώσσα'. Ωστόσο, πιστεύουμε ότι θα είχε ενδιαφέρον να συζητηθεί μια τυπολογία που συνδυάζει τον άξονα 'προφορικός / γραπτός λόγος' με τον άξονα 'διάλογος / μονόλογος' και καταλήγει σε τέσσερις μήτρες ειδών λόγου: προφορικός διάλογος (καθημερινή συνομιλία, τηλεφωνική συνομιλία κ.ά.), προφορικός μονόλογος (διάλεξη, κήρυγμα, προεκλογική ομιλία ενός πολιτικού κ.ά.), γραπτός διάλογος (φιλική επιστολή, e-mail κ.ά.) και γραπτός μονόλογος (νόμοι, κανονισμοί κ.ά.)[7]. Οι εν λόγω κατηγορίες ειδών λόγου μπορούν εύκολα να χαρακτηριστούν ως προς το επίπεδο ύφους (ποιοι μιλούν / γράφουν σε ποιους), άρα, και ως προς τη σχέση τους με την άτυπη ή την τυπική γλώσσα. Εννοείται ότι ένα σώμα γραπτών κειμένων, όπως ο ΕΘΕΓ, μπορεί να εκμεταλλευτεί μόνο τις δύο τελευταίες μήτρες ειδών λόγου.

Η περιγραφή και ο σχολιασμός των ταξινομικών αρχών του ΕΘΕΓ ολοκληρώνεται με την αναφορά στο κριτήριο του «γένους / κειμενικού είδους». Στο εισαγωγικό σημείωμα του corpus περιγράφονται οι εξής κατηγορίες κειμενικών ειδών: βιογραφία (αυτοβιογραφία, βιογραφικό σημείωμα κ.ά.), γνώμη (κυρίως δημοσιογραφικά άρθρα και επιστημονικά άρθρα ή εργασίες), διαφήμιση (κάθε είδους διαφημιστικό κείμενο, αναγγελίες εκδηλώσεων), επίσημο κείμενο (κυρίως γραφειοκρατικά κείμενα), ιδιωτικό κείμενο (προσωπική επιστολή, ημερολόγιο), λογοτεχνία (παραμύθια, στίχοι, σενάρια, λογοτεχνικά έργα), πληροφόρηση (κείμενα ενημερωτικής πληροφόρησης όπως οι ειδήσεις ή οι τουριστικοί οδηγοί, κείμενα εξηγητικής πληροφόρησης όπως τα ερωτηματολόγια και οι δημοσκοπήσεις, κείμενα επιστημονικής πληροφόρησης όπως οι εγκυκλοπαίδειες και τα διδακτικά εγχειρίδια), συζήτηση (συνέντευξη, συνομιλία κ.ά.) και αδιευκρίνιστο. Θα πρέπει εξαρχής να τονιστεί ότι δεν υπάρχει (ίσως, δεν πρόκειται ποτέ να υπάρξει) ταξινόμηση κειμενικών ειδών καθολικής αποδοχής. Από την άλλη μεριά, είναι αδύνατο, στο πλαίσιο μιας παρουσίασης, να σχολιάσουμε σε βάθος τα θεωρητικά ζητήματα που θέτει η τυπολογία των ταξινομήσεων κειμενικών ειδών[8]. Ωστόσο, μπορούμε να επισημάνουμε το γεγονός ότι η επιλογή ταξινομικής βάσης οδηγεί κάθε φορά σε μια νέα τυπολογία. Ο ΕΘΕΓ δοκίμασε δύο ταξινομικές βάσεις, αυτήν του εισαγωγικού σημειώματος, με τις κατηγορίες κειμενικών ειδών που προαναφέραμε, και εκείνη της αναθεωρητικής φάσης (Γαβριηλίδου κ.ά., 1995:841). Θα τις σχολιάσουμε εν συντομία.

Η ταξινομική αρχή της κατηγοριοποίησης των κειμενικών ειδών που προτείνεται στο εισαγωγικό σημείωμα του corpus φαίνεται να είναι ο επικοινωνιακός στόχος ενός κειμενικού είδους. Μια κειμενική τυπολογία με κριτήριο τον σκοπό του λόγου (aim of discourse) είναι αυτή που έχει προταθεί από τον Kinneavy (1971). O συγγραφέας, αντιμετωπίζοντας ως στόχους τούς βασικούς συντελεστές μιας επικοινωνιακής πράξης (πομπό, δέκτη, μήνυμα, πραγματικότητα), προτείνει αντίστοιχα τέσσερις οικογένειες κειμένων. Τα κείμενα που στοχεύουν τον πομπό, τον ίδιο τον δημιουργό τους, είναι κείμενα προσωπικής (ή συλλογικής έκφρασης). Τα κείμενα που στοχεύουν τον δέκτη είναι κείμενα πειθούς. Τα κείμενα που στοχεύουν την πραγματικότητα είναι πληροφοριακά κείμενα. Τέλος, τα κείμενα που στοχεύουν το μήνυμα είναι λογοτεχνικά. Από τις κατηγορίες που προτείνει το εισαγωγικό σημείωμα του ΕΘΕΓ, η «βιογραφία» και τα «ιδιωτικά κείμενα» μπορούν να θεωρηθούν υποκατηγορίες της ίδιας κατηγορίας (κείμενα προσωπικής έκφρασης), γιατί πρόκειται για «πρωτοπρόσωπα» κείμενα με ευρύ ή περιορισμένο κοινό. Η «διαφήμιση» και, ως έναν βαθμό, η «γνώμη» είναι κείμενα λογικής ή/και συναισθηματικής πειθούς. Η «πληροφόρηση», τα «επίσημα κείμενα» και, ως έναν βαθμό, η «γνώμη» περιλαμβάνουν κείμενα ενημερωτικής, εξηγητικής και ερμηνευτικής πληροφόρησης. Η «λογοτεχνία», τέλος, ταυτίζεται με την οικογένεια των λογοτεχνικών κειμένων. Μένει χωριστή η κατηγορία «συζήτηση», που περιλαμβάνει κείμενα πρωτογενώς προφορικά και συνομιλιακά, που όμως μπορούν, ανάλογα με το περιεχόμενο της «συζήτησης», να ενταχθούν στις παραπάνω κατηγορίες. Ας μας επιτραπεί να παρατηρήσουμε ότι η κατηγορία «αδιευκρίνιστο» δεν είναι χρήσιμη σε μια κατηγοριοποίηση κειμένων με βάσει το κειμενικό είδος, αφενός επειδή δεν δίνει κειμενολογικές πληροφορίες και αφετέρου επειδή υπονομεύει την ίδια την κατηγοριοποίηση. Γενικά, θα λέγαμε, ότι παρά τον φαινομενικά ετερόκλητο χαρακτήρα της, η προτεινόμενη ταξινόμηση είναι πλήρης και συνεπής ως προς το κριτήριο του επικοινωνιακού στόχου.

Η αναθεώρηση των ταξινομικών κριτηρίων του ΕΘΕΓ περιέλαβε και την αλλαγή της ταξινομικής βάσης για την κατηγοριοποίηση των κειμενικών ειδών. Τώρα, το κριτήριο δεν είναι ο επικοινωνιακός στόχος αλλά οι «τομείς ανθρώπινης επικοινωνίας». Η αλλαγή ήταν απαραίτητη, αφού αυτή η σχάρα τομέων (λογοτεχνία, επιστήμη, διοίκηση, τέχνη, τύπος, καθημερινή ζωή) είναι η βάση όλων των ταξινομήσεων της δεύτερης φάσης του corpus. Αν η πρώτη ταξινόμηση μπορεί να θεωρηθεί λειτουργική, η εν λόγω είναι κοινωνική / επαγγελματική. Η πρώτη στηριζόταν στην προθετικότητα (για ποιο λόγο γράφεται ένα κείμενο), ενώ η δεύτερη στη χαρτογράφηση του γραμματισμού των κυριότερων τομέων της ανθρώπινης δραστηριότητας. Η πρώτη ταξινόμηση πρότεινε σχέσεις υπαγωγής ανάμεσα σε γένη και είδη. Η δεύτερη ταξινόμηση προτείνει σχέσεις υπαγωγής ανάμεσα σε κοινωνικούς χώρους και συναφή κειμενικά είδη. Θα μπορούσε κανείς να πει ότι και οι δύο προσφέρουν απαραίτητες πληροφορίες για την ταυτότητα των κειμενικών ειδών. Η δεύτερη ταξινόμηση αντικατέστησε την πρώτη, επειδή προφανώς θεωρήθηκε ότι προσφέρει πιο ευέλικτη και αντιπροσωπευτική βάση υποκατηγοριοποίησης.

Θα ήταν παράλειψη να μην αναφέρουμε ότι, πέραν όλων των στοιχείων που εξετάσαμε, ο ΕΘΕΓ δίνει πληροφορίες και για το περικείμενο των κειμένων. Το όνομα του συγγραφέα ή του μεταφραστή, ο τίτλος, ο υπότιτλος, η χρονολογία και ο τόπος έκδοσης, ο εκδότης κ.λπ. είναι στοιχεία που βρίσκονται στη διάθεση του χρήστη και διευκολύνουν, αποφασιστικά μερικές φορές, την πρόσληψη και ερμηνεία του κειμενικού μηνύματος.

Αξιολόγηση των διδακτικών δυνατοτήτων του ΕΘΕΓ.

Το σώμα κειμένων του ΕΘΕΓ είναι πολύτιμη βάση για τη μελέτη του ύφους, δηλαδή των λεξικο-γραμματικών γνωρισμάτων, των κειμενικών ειδών που έχουν ανθολογηθεί. Και πιο συγκεκριμένα, μπορούν με μεγάλη ευχέρεια και ταχύτητα να μελετηθούν οι τρεις κατηγορίες σημασιών που αντιστοιχούν στις συμφραστικές παραμέτρους (πεδίο, τρόπος και επίπεδο ύφους), σύμφωνα πάντοτε με το πρότυπο της συστημικής λειτουργικής γραμματικής (βλ. παραπάνω): οι αναπαραστατικές σημασίες, οι διαπροσωπικές σημασίες και οι κειμενικές σημασίες. Οι πρώτες φωτογραφίζουν το περιεχόμενο ενός κειμένου, οι δεύτερες τη δυναμική της σχέσης του πομπού με τον δέκτη όπως αυτή αποτυπώνεται γλωσσικά στο κείμενο, ενώ οι τρίτες δείχνουν τους τρόπους αρμολόγησης του κειμένου (Halliday 1985). Ο συνδυασμός αυτών των τριών κατηγοριών σημασιών μπορεί να μας δώσει το γλωσσικό προφίλ ενός κειμένου ως αντιπροσώπου ενός κειμενικού είδους.

Σε ό,τι αφορά τις αναπαραστατικές (ή περιγραφικές) σημασίες, αυτό που ενδιαφέρει είναι οι μετέχοντες, οι διαδικασίες και οι περιστάσεις. 'Διαδικασίες' είναι ο τεχνικός όρος για τις ευάριθμες σημασιολογικές κατηγορίες των ρημάτων μιας γλώσσας (ρήματα δράσης, ρήματα λεκτικά, ρήματα συνδετικά κ.ά.). 'Μετέχοντες' είναι οι σημασιολογικοί ρόλοι, οι οντότητες που σχετίζονται με τις διαδικασίες και οι οποίες αντιστοιχούν, με όρους σύνταξης, στο υποκείμενο της πρότασης και το συμπλήρωμα του ρήματος. 'Περιστάσεις' είναι ο τεχνικός όρος για το σύνολο των επιρρηματικών προσδιορισμών που εξειδικεύουν τη ρηματική ενέργεια. Και για να επιστρέψουμε στις δυνατότητες του corpus: αν ο χρήστης επιλέξει κάποιο κειμενικό είδος (π.χ. τη διαφήμιση) έχει τη δυνατότητα, με τη βοήθεια των συμφραστικών πινάκων, να μελετήσει τα περιβάλλοντα όλων των ρηματικών ενεργειών που εμφανίζονται να επιτελούν οι μετέχοντες οι οποίοι εμπλέκονται στα διαφημιστικά μηνύματα, καθώς επίσης και τις αντίστοιχες χωρο-χρονικές κ.λπ. επιρρηματικές σχέσεις. Έτσι, μπορεί ο χρήστης να αποκομίσει μια αντιπροσωπευτική εικόνα του τρόπου με τον οποίο η (έντυπη) διαφήμιση αναπαριστά την πραγματικότητα που την αφορά. Μπορεί, για παράδειγμα, να διαπιστώσει αν οι 'δράστες' είναι πρόσωπα ή προϊόντα ή, ακόμη ιδιότητές τους. Μπορεί να ελέγξει αν οι 'δράστες' ασκούν κάποια δραστηριότητα ή απλώς αισθάνονται ή αν τους αποδίδονται ιδιότητες και ποιες. Κι όλα αυτά σε σχέση με τον χρόνο, τον τόπο, την αιτία, τον τρόπο, την αναφορά κ.λπ.

Οι διαπροσωπικές σημασίες ρυθμίζονται κυρίως με την επιλογή των χρόνων, των εγκλίσεων, των προσώπων και των τροπικοτήτων (της δεοντικής και της επιστημικής). Στην περίπτωση, και πάλι, της διαφήμισης, μπορούμε να ελέγξουμε αν επαληθεύονται γνωστές υποθέσεις για την υπεροχή της προστακτικής έγκλισης, του δεύτερου πληθυντικού προσώπου, του αόριστου (συνοπτική ρηματική όψη) κ.λπ. Μπορεί, επίσης, να ελεγχθεί η παρουσία της δεοντικής τροπικότητας (πρέπει, επιτρέπεται, απαγορεύεται κ.ά.) και της επιστημικής τροπικότητας (μπορεί, ίσως, πιθανόν κ.ά.). Η εξέταση αυτών των γραμματικών δεικτών αναδεικνύει εκείνη την πλευρά του ύφους ενός κειμένου που σχετίζεται με τη διαπραγμάτευση του νοήματος μεταξύ του συγγραφέα και του αναγνώστη.

Τέλος, οι κειμενικές σημασίες, που περιγράφουν τη συνοχή ενός κειμένου, και κυρίως η χρήση συνδεσμικών στοιχείων, μπορεί επίσης να ανιχνευθεί με τη βοήθεια των συμφραστικών πινάκων του corpus. Στην περίπτωση της διαφήμισης μπορεί να μελετηθεί, για παράδειγμα, η χρήση συμπλεκτικών, αντιθετικών ή διαζευκτικών συνδέσμων και, επιπλέον, η χρήση συνδετών (λοιπόν, επομένως, γι' αυτό, έτσι κ.λπ.), που αναδεικνύει μορφές επιχειρηματολογίας του εν λόγω κειμενικού είδους.

Η υφομετρική χρήση του ΕΘΕΓ, που συνδυάζει συμφραστικούς πίνακες και κειμενικά είδη, είναι η πιο απαιτητική αλλά και πιο γοητευτική διερεύνηση της ταυτότητας των κειμένων που παράγονται από τους χρήστες της νέας ελληνικής. Ωστόσο, το corpus, εκτός από τη μελέτη γλωσσικών χρήσεων (δηλαδή, κειμενικών πραγματώσεων), επιτρέπει και τη διεξοδική μελέτη της μορφολογίας της νέας ελληνικής. Όπως εξηγείται και στο εισαγωγικό σημείωμα, ο χρήστης μπορεί να ανασύρει από το corpus γραμματικές κατηγορίες ή/και μορφολογικούς τύπους, και μάλιστα μέσα στα γλωσσικά τους περιβάλλοντα, δηλαδή σε πραγματικές και όχι κατασκευασμένες προτάσεις. Συνοψίζοντας, θα λέγαμε ότι ο ΕΘΕΓ αποτελεί πολύτιμο εργαλείο για τη μελέτη και τη διδασκαλία του συστήματος της γλώσσας μας και των γλωσσικών χρήσεων που επιτελούνται στο εσωτερικό της.

Βιβλιογραφικές αναφορές.

 1. Γαβριηλίδου Μ., Π. Λαμπροπούλου, Σ. Ρονιώτη (1993). "Σχεδιασμός και σχολιασμός ενός ελληνικού σώματος κειμένων", Μελέτες για την Ελληνική Γλώσσα. Πρακτικά της 14ης Συνάντησης του Τομέα Γλωσσολογίας της Φιλοσοφικής Σχολής του Α.Π.Θ., 308-322. Θεσσαλονίκη.
 2. Γαβριηλίδου Μ., Π. Λαμπροπούλου, Α. Χριστοφίδου (1995). "Σύστημα κατηγοριοποίησης γραπτών κειμένων", Μελέτες για την Ελληνική Γλώσσα. Πρακτικά της 15ης Συνάντησης του Τομέα Γλωσσολογίας της Φιλοσοφικής Σχολής του Α.Π.Θ., 831-842. Θεσσαλονίκη.
 3. Παυλίδου Θ.-Σ. (2002). GR-SPEECH: Σώματα ελληνικών προφορικών κειμένων, Μελέτες για την Ελληνική Γλώσσα. Πρακτικά της 22ης Συνάντησης του Τομέα Γλωσσολογίας της Φιλοσοφικής Σχολής του Α.Π.Θ., Τόμος Δεύτερος (Υπολογιστική Γλωσσολογία), 124-134. Θεσσαλονίκη.
 4. Πολίτης Π. (2001). "Προφορικός και γραπτός λόγος", στο Α.-Φ. Χριστίδης (επιμ., σε συνεργασία με τη Μ. Θεοδωροπούλου), Εγκυκλοπαιδικός οδηγός για τη γλώσσα, 58-62. Θεσσαλονίκη: Κέντρο Ελληνικής Γλώσσας (βλ. επίσης www.komvos.edu.gr).
 5. Χατζηγεωργίου Ν., Α. Σπηλιωτοπούλου, Α. Βακαλοπούλου, Α. Παπακωστοπούλου, Σ. Πιπερίδης, Μ. Γαβριηλίδου, Γ. Καραγιάννης (2001). "Εθνικός Θησαυρός Ελληνικών Κειμένων (ΕΘΕΓ): Σώμα κειμένων της Νέας Ελληνικής στο Διαδίκτυο", Μελέτες για την Ελληνική Γλώσσα. Πρακτικά της 21ης Συνάντησης του Τομέα Γλωσσολογίας της Φιλοσοφικής Σχολής του Α.Π.Θ., 812-821. Θεσσαλονίκη.
 6. Crowston K. & M. Williams (1997). "Reproduced and emergent genres of communication on the World-Wide Web", στο Proceedings of the Thirtieth Annual Hawaii International Conference on System Sciences, Maui, Hawaii, vol. 6, pp. 30-39.
 7. Eggins S. (1994). An Introduction to Systemic Functional Linguistics. London: Pinter.
 8. Gerot L. (1995). Making Sense of Text. Gold Coast, QLD: Antipodean Educational Enterprises.
 9. Gregory M. (1967). "Aspects of varieties differentiation", Journal of Linguistics 3(2): 177-274.
 10. Halliday M.A.K. (1978) Language as a Social Semiotic. London: Edward Arnold.
 11. Halliday M.A.K. (1985) An Introduction to Functional Grammar. London: Edward Arnold.
 12. Halliday M.A.K. (1989). "Register Variation", στο Halliday M.A.K. & R. Hasan, Language, context and text: aspects of language in a social-semiotic perspective, 29-43. Oxford: Oxford University Press.
 13. Kinneavy J. (1971). A Theory of Discourse. The Aims of Discourse. Englewood Cliffs, N.J.: Prentice-Hall.
 14. Shepherd M. & C. Watters (1998) "The Evolution of Cybergenres", στο R. Sprague Jr. (ed.) Proceedings of the 30th Annual Hawaii International Conference on System Sciences, 97-109. Los Alamitos, CA: IEEE-Computer Society.
 15. Troborg A. (1997). "Text Typology: Register, Genre and Text Type", στο Troborg A. (ed.) Text Typology and Translation, 3-23. Amsterdam / Philadelphia: John Benjamins.

1 Η ομάδα εργασίας του ΕΘΕΓ σε επιστημονική ανακοίνωσή της, η οποία περιγράφει τη δομή και τη λειτουργία τού corpus, αναφέρει ότι το μέγεθός του φτάνει τις 20.000.000 λέξεις (Χατζηγεωργίου κ.ά., 2001: 812). Πρόσφατα, στο σώμα κειμένων του ΕΘΕΓ προστέθηκαν και άλλες λέξεις (περισσότερες από 10.000). Η παρουσίαση αυτή αναφέρεται στην προηγούμενη μορφή του ΕΘΕΓ, σε αυτή των 35.000.000 λέξεων, για την οποία ακόμη υπάρχει δυνατότητα αναζήτησης όπως μπορείτε να δείτε από την ιστοσελίδα του ΙΕΛ.

2 Για μια περιεκτική εισαγωγή στην προβληματική που σχετίζεται με τον καταρτισμό σώματος ελληνικών προφορικών κειμένων βλ. Παυλίδου, 2002.

3 Στην πρώτη παρουσίαση του ΕΘΕΓ (Γαβριηλίδου κ.ά., 1993: 313) η συνέντευξη περιλαμβάνεται στα κειμενικά είδη που επιλέχτηκαν για το corpus. Αντίθετα, από μεταγενέστερη παρουσίασή του (Γαβριηλίδου κ.ά., 1995: 839-41) συνάγεται ότι δεν έχουν ενσωματωθεί σ' αυτό είδη του προφορικού λόγου. Πάντως, το εισαγωγικό σημείωμα του ΕΘΕΓ κάνει σαφή μνεία της «συζήτησης» ως γένους / κειμενικού είδους που φιλοξενείται στο corpus.

4 Στο εισαγωγικό σημείωμα, ωστόσο, διευκρινίζεται ότι ο μεγάλος όγκος των κειμένων που επιλέχτηκαν έχουν δημοσιευτεί μετά το 1990.

5 Τέτοια είναι, με χρονολογική σειρά έκδοσης: το Νέο Ελληνικό Λεξικό της Σύγχρονης Δημοτικής Γλώσσας του Ε. Κριαρά (1995), το Λεξικό της Νέας Ελληνικής Γλώσσας του Γ. Μπαμπινιώτη (1998) και το Λεξικό της Κοινής Νεοελληνικής του Ινστιτούτου Νεοελληνικών Σπουδών του ΑΠΘ (1998).

6 Στη φάση της πρώτης αναθεώρησης του ΕΘΕΓ, ο terminus post quem του corpus, το έτος 1975, μετακινήθηκε προς τα πίσω, αλλά μόνο για τη λογοτεχνία, για να περιληφθούν κείμενα των λογοτεχνών της «Γενιάς του 30», που θεωρήθηκαν ότι δεν αποκλίνουν από τη στάνταρ ποικιλία (Γαβριηλίδου κ.ά., 1995: 835).

7 Για περισσότερες λεπτομέρειες βλ. Πολίτης, 2001.

8 Για μια πρώτη προσέγγιση του ζητήματος της τυπολογίας των κειμενικών τυπολογιών βλ. Troborg, 1997.

Τελευταία Ενημέρωση: 03 Ιούλ 2008, 16:36