Bodossaki Lectures on Demand
ΙΔΡΥΜΑ ΜΠΟΔΟΣΑΚΗ

The Diachronic Corpus of Greek of the 20th century (Greek Corpus 20): Issues of design and compilation

Γούτσος Διονύσης

28 Ιουνίου 2013

ΟΜΙΛΙΕΣ
EXIT FULL SCREEN VIDEO & SLIDES
ΔΙΑΡΚΕΙΑ 42:02 ΠΡΟΒΟΛΕΣ 1597
ΔΙΑΦΑΝΕΙΕΣ /

Το Διαχρονικό Σώμα Ελληνικών Κειμένων του 20ού αιώνα (Greek Corpus 20): Ζητήματα σχεδιασμού και δημιουργίας

Το ερευνητικό πρόγραμμα Διαχρονικό Σώμα Ελληνικών Κειμένων του 20ού αιώνα (Greek Corpus 20) έχει σχεδιαστεί με στόχο την ανάπτυξη ενός σώματος κειμένων της Ελληνικής 20 εκατομμυρίων λέξεων από τις πρώτες εννέα δεκαετίες του 20ού αιώνα, το οποίο θα ενσωματωθεί στο ήδη υπάρχον Σώμα Ελληνικών Κειμένων, που αποτελείται από 30 εκατομμύρια λέξεις (ΣΕΚ, http://sek.edu.gr) και περιλαμβάνει κείμενα από τη δεκαετία του 1990 έως το 2010. Το σώμα κειμένων έχει ως στόχο τη μελέτη των πεδίων της πρόσφατης γραμματικής και λεξιλογικής αλλαγής της Ελληνικής μέσω της ανάλυσης αυθεντικών κειμένων. Η ομιλία επιχειρεί αρχικά μια επισκόπηση της έρευνας με σώματα κειμένων στα Ελληνικά και στη συνέχεια παρουσιάζει τους κύριους στόχους του Διαχρονικού Σώματος Ελληνικών Κειμένων του 20ού αιώνα στο πλαίσιο αυτής της έρευνας. Αναφέρομαι ειδικότερα στα ιδιαίτερα χαρακτηριστικά της Ελληνικής ως γλώσσας με ιστορία που ξεπερνά τις 4 χιλιετίες, στην πολύπλοκη κοινωνιογλωσσική κατάσταση της Ελληνικής του 20ού αιώνα, που περιλαμβάνει το ζήτημα της κοινωνικής διγλωσσίας, και στις ιδιαιτερότητες συλλογής δεδομένων στα ελληνικά (απουσία υλικού, ορθογραφικές μεταρρυθμίσεις κ.λπ.). Βασικός στόχος είναι να συζητηθούν πώς τα ζητήματα αυτά επηρεάζουν το σχεδιασμό και τη συγκρότηση του σώματος κειμένων.

Η ανακοίνωση πραγματοποιήθηκε στο πλαίσιο ημερίδας που διοργανώθηκε από το πρόγραμμα «Διαχρονικό Σώμα Ελληνικών Κειμένων του 20ού αιώνα» (Greek Corpus 20, http://greekcorpus20.phil.uoa.gr/), το οποίο συγχρηματοδοτείται από το Ευρωπαϊκό Κοινωνικό Ταμείο και την Ελλάδα (Ερευνητικό πρόγραμμα «Αριστεία»). Στόχος της ημερίδας ήταν η συζήτηση και ο προβληματισμός για τις βασικές αρχές και τις ορθές πρακτικές που αφορούν στη συγκρότηση διαχρονικών σωμάτων κειμένων με σκοπό τη γλωσσολογική έρευνα. Η εμπειρία μελετητών που έχουν εργαστεί σε σχετικά ερευνητικά προγράμματα σε άλλες γλώσσες αναμένεται να συμβάλει σημαντικά στη διαμόρφωση των στόχων και των πρακτικών του διαχρονικού σώματος κειμένων της Ελληνικής, καθώς, σε αντίθεση με άλλες γλώσσες, η Ελληνική δεν έχει επωφεληθεί έως τώρα από την ανάπτυξη της υπολογιστικής γλωσσολογίας σωμάτων κειμένων στο βαθμό που θα αναμενόταν: η έλλειψη ενός διαχρονικού σώματος κειμένων της Ελληνικής αποτελεί ένα μείζον κενό στην ελληνική γλωσσολογία και το ερευνητικό πρόγραμμα στοχεύει να καλύψει αυτό το κενό, αναπτύσσοντας ένα σώμα κειμένων 20 εκατ. λέξεων για τις πρώτες εννέα δεκαετίες του 20ου αιώνα, το οποίο θα ενσωματωθεί στο προϋπάρχον σώμα κειμένων 30εκατ. λέξεων του ΣΕΚ. Στόχος του σώματος κειμένων είναι η μελέτη περιοχών πρόσφατης γλωσσικής αλλαγής (τόσο σε γραμματικό όσο και σε λεξιλογικό επίπεδο) μέσω της ανάλυσης αυθεντικών κειμένων.

Γούτσος Διονύσης Καθηγητής, Τομέας Γλωσσολογίας, Τμήμα Φιλολογίας, ΕΚΠΑ

Ο Διονύσης Γούτσος είναι Καθηγητής Κειμενογλωσσολογίας στο Πανεπιστήμιο Αθηνών. Έχει διδάξει στο Πανεπιστήμιο του Birmingham και στο Πανεπιστήμιο Κύπρου. Έχει γράψει άρθρα για την κειμενογλωσσολογία και την ανάλυση λόγου, τις μεταφραστικές σπουδές, τη γλωσσολογία των σωμάτων κειμένων κ.ά. Έχει δημοσιεύσει, μεταξύ άλλων, τα βιβλία Modeling Discourse Topic (1997), Κείμενο και Επικοινωνία (1999/2011, με την Αλεξάνδρα Γεωργακοπούλου), Ο Λόγος της Μετάφρασης (2001) και Γλώσσα: Κείμενο, Ποικιλία, Σύστημα (2012). Ασχολείται με την ανάπτυξη και επεξεργασία ηλεκτρονικών σωμάτων κειμένων και είναι επιστημονικός υπεύθυνος των προγραμμάτων για την ανάπτυξη των σωμάτων Σώμα Ελληνικών Κειμένων και Διαχρονικό σώμα ελληνικών κειμένων 20ού αιώνα, στο πλαίσιο του ερευνητικού προγράμματος «Αριστεία», αλλά και ειδικευμένων σωμάτων κειμένων προφορικού λόγου από καθημερινές συνομιλίες και λόγου αφασικών ομιλητών.

Σχετικές ομιλίες