Bodossaki Lectures on Demand

Εργαλεία υποστήριξης της ελληνικής γλώσσας στους υπολογιστές: Η απάντηση των ειδικών

Γλάρος Νίκος, Τσαλίδης Χρήστος, Ναδάλης Κώστας, Γαβριηλίδου Μαρία, Προκοπίδης Προκόπης, Κατσούρος Βασίλης, Τσιάκουλης Πύρρος, Πιπερίδης Στέλιος

25 Σεπτεμβρίου 2015

ΟΜΙΛΙΕΣ
EXIT FULL SCREEN VIDEO & SLIDES
ΔΙΑΡΚΕΙΑ 115:01 ΠΡΟΒΟΛΕΣ 1346
ΔΙΑΦΑΝΕΙΕΣ /

Εργαλεία υποστήριξης της ελληνικής γλώσσας στους υπολογιστές
 

Ημερίδα Εργασίας που οργάνωσαν το Γραφείο Αθηνών της Γενικής Διεύθυνσης Μετάφρασης και το Ινστιτούτο Επεξεργασίας του Λόγου / ΕΚ «Αθηνά» σχετικά με τις ελλείψεις και τις προοπτικές όσον αφορά τα εργαλεία υποστήριξης της ελληνικής γλώσσας στους υπολογιστές.


 

Δεύτερη ενότητα: Η απάντηση των ειδικών (8 σύντομες παρουσιάσεις)

1η παρουσίαση: Γλάρος Νίκος  - Αυτόματη Διόρθωση Κειμένων

Στην ομιλία αυτή αναφέρθηκαν οι τύποι των λαθών που πρέπει να διορθώνονται από έναν αυτόματο διορθωτή κειμένων και τα ιδιαίτερα προβλήματα της διόρθωσης ελληνικών κειμένων. Αναλύθηκαν τα χαρακτηριστικά του διορθωτή ελληνικών κειμένων «Συμφωνία» που ανέπτυξε το ΙΕΛ καθώς και τα χαρακτηριστικά των αναβαθμίσεων του εν λόγω λογισμικού «Συμφωνία+» και «Νέα Συμφωνία».


2η παρουσίαση: Τσαλίδης Χρήστος -Γλωσσική Τεχνολογία
Στην ομιλία αυτή παρουσιάστηκε η εργασία που έχει κάνει η εταιρεία Neurolingo στον τομέα της Γλωσσικής τεχνολογίας για την ανάπτυξη μιας σειράς ρεγαλείων υποστήριξης της Ελληνικής γλώσσας που χρησιμοποιούνται ήδη σε προϊόντα ευρείας κυκλοφορίας όπως π.χ. ο Ορθογράφος, Συλλαβιστής και Θησαυρός γιαMSOffice (MSWin) / MSOfficeX (MacOSX) / LibreOffice (OpenOffice), μέρη του οποίου χρησιμοποιούνται στα AdobeIn Design, Photoshop, Illustrator (Ορθογράφος, Συλλαβιστής) και στα MSWin & MacOSXκαι ως System Services στο MacOS (Ορθογράφος, Θησαυρός).


3η παρουσίαση: Ναδάλης Κώστας - Μετάφραση
Η ομιλία κάλυψε τα ολοκληρωμένα περιβάλλοντα επεξεργασία δίγλωσσων κειμένων που χρησιμοποιούνται ευρέως από τους μεταφραστές. Αναφέρθηκαν τα κυριότερα προβλήματα που οφείλονται κυρίως στο μέγεθος της ελληνικής αγοράς. Προτάθηκαν επίσης και κάποιες πρακτικές λύσεις.


4η παρουσίαση: Γαβριηλίδου Μαρία – Ελληνικά σώματα κειμένων
Στην ομιλία αναφέρθηκαν οι δυνητικές χρήσεις των σωμάτων κειμένων και αναλύθηκαν οι ιδιότητες των διαθέσιμων σωμάτων ελληνικών κειμένων. αναφέρθηκαν επίσης παραδείγματα πολύγλωσσων σωμάτων που περιλαμβάνουν και ελληνικά. Τέλος αναφέρθηκαν τα νομικά και τεχνικά προβλήματα που συνδέονται με την χρήση των σωμάτων κειμένων και προτάθηκαν κάποιες λύσεις.


5η παρουσίαση: Προκοπίδης Προκόπης - Εργαλεία γλωσσικής επεξεργασίας για την ελληνική γλώσσα
Στο πλαίσιο της ομιλίας αναφέρθηκαν κατ' αρχάς οι οργανισμοί και οι ομάδες επεξεργασίας φυσικής γλώσσας στην Ελλάδα. Αναλύθηκαν στη συνέχεια ορισμένα βασικά εργαλεία επεξεργασίας φυσικής γλώσσας (μορφολογικός χαρακτηριστής, λημματοποιητής, εργαλεία συντακτικής ανάλυσης και αναγνώρισης ονοματικών οντοτήτων, εργαλεία αναγνώρισης γεγονότων, εντοπισμού άποψης και μείωσης μήκους κειμένου). Περιγράφηκαν επίσης ορισμένες πρακτικές εφαρμογές όπως η διασύνδεση με την Wikipedia, η βελτιωμένη αναζήτηση και η δημιουργία μονογλωσσικών και πολυγλωσσικών γλωσσικών πόρων από το web.


6η παρουσίαση: Κατσούρος Βασίλης - Τεχνολογίες Αναγνώρισης Φωνής
Η ομιλία περιελάμβανε περιγραφή της δομήςενός συστήματος αναγνώρισης φωνής και των επιμέρους στοιχείων του (ακουστικό μοντέλο, γλωσσικό μοντέλο, αναζήτηση και αποκωδικοποίηση). Αναφέρθηκαν επίσης ορισμένες μηχανές αναγνώρισης φωνής (εμπορικές και ανοικτού κώδικα) καθώς και υφιστάμενες εφαρμογές αναγνώρισης φωνής. Τέλος αναλύθηκαν οι συντελεστές επιτυχίας εφαρμογών αναγνώρισης φωνής και ορισμένες ανοικτές προκλήσεις.


7η παρουσίαση: Τσιάκουλης Πύρρος - Σύνθεση Ομιλίας
Η ομιλία κάλυψε τα θέματα: Τι είναι η συνθετική ομιλία και πού χρησιμεύει. Στάδια της ανάπτυξής της για τα Ελληνικά και σημερινή κατάσταση. Ανάλυση της τεχνολογίας της συνθετικής ομιλίας. Οι διακρίσεις της εταιρείας innoetics και τα μελλοντικά σχέδια στον υπόψη τομέα.


8η παρουσίαση: Πιπερίδης Στέλιος - Υποδομές
Ο ομιλητής εξήγησε ότι οι εργασίες στον τομέα των υποδομών για γλωσσικούς πόρους εστιάζονται σε ανοικτές και κατανεμημένες αρχιτεκτονικές, σε συμμετοχικές προσπάθειες και στην προώθηση κοινών λύσεων. Κύριος στόχος είναι η γεφύρωση του χάσματος μεταξύ παρόχων και καταναλωτών γλωσσικών πόρων και υπηρεσιών, καθώς και η προώθηση του διαμοιρασμού, της διατήρησης και της επαναχρησιμοποίησης τους

Στη συνέχεια περιέγραψε τον τρόπο λειτουργίας της υποδομής CLARIN elκαι την χρήση της για την παραγωγή νέων γλωσσικών πόρων με βάση τις ανάγκες


Ιστοσελίδες των διοργανωτών:
Ιστοσελίδα του Γραφείου Αθηνών της Γενικής Διεύθυνσης Μετάφρασης της Ευρωπαϊκής Επιτροπής, Ινστιτούτο Επεξεργασίας του Λόγου / ΕΚ «Αθηνά»

Γλάρος Νίκος Ηλεκτρολόγος Μηχανικός, Ινστιτούτο Επεξεργασίας του Λόγου / Ερευνητικό Κέντρο ‘Αθηνά’
Ο Δρ Νίκος Γλάρος απέκτησε πτυχίο και διδακτορικό δίπλωμα από την Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Εθνικού Μετσόβιου Πολυτεχνείου. Από το 1992 μέχρι σήμερα (2015) εργάζεται στο Ινστιτούτο Επεξεργασίας του Λόγου, έχοντας συμμετάσχει στην υλοποίηση και έχοντας αναλάβει την διαχείριση μιας σειράς από εθνικά, ευρωπαϊκά και άλλα αναπτυξιακά/ερευνητικά έργα σε διάφορους τομείς της γλωσσικής τεχνολογίας. Ενδεικτικοί τομείς εξειδίκευσης είναι: συστήματα αναγνώρισης/ανάλυσης/σύνθεσης φωνής, κατασκευή ψηφιακών πολιτιστικών αρχείων, ανάπτυξη εφαρμογών βασισμένων σε υπολογιστικά λεξικά και άλλους γλωσσικούς πόρους, συστήματα διόρθωσης κειμένων, επεξεργασία σωμάτων κειμένων κ.ά.
Τσαλίδης Χρήστος Διαχειριστής Neurolingo
Ο Δρ Χρήστος Τσαλίδης είναι απόφοιτος του τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής (Πανεπιστήμιο Πατρών). Το 1991 ολοκλήρωσε τη διδακτορική του διατριβή με θέμα «Ολοκληρωμένη Μέτρηση Ποιοτικών Χαρακτηριστικών Λογισμικού Ανεξάρτητα από Γλώσσα Προγραμματισμού» στο Τμήμα Μηχανικών Η/Υ και Πληροφορικής του Πανεπιστημίου Πατρών. Δίδαξε τα μαθήματα: Βάσεις Δεδομένων, Τεχνολογία Λογισμικού, Εισαγωγή στο Λογισμικό (C, C++, Java), Δομές Δεδομένων & Αλγόριθμοι, Μεταγλωττιστές σε Πανεπιστήμια & ΤΕΙ. Συμμετείχε ως ερευνητής σε ερευνητικά και αναπτυξιακά προγράμματα τα οποία χρηματοδοτήθηκαν από την ΕΕ, την ΓΓΕΤ ή την ελληνική βιομηχανία. Κάθε έργο παρήγαγε μια σειρά από ερευνητικά αποτελέσματα τα οποία οδήγησαν σε δημοσιεύσεις, παρήχθησαν πρωτότυπα προϊόντα (software) τα οποία παρουσιάσθηκαν σε διεθνείς εκθέσεις και συναντήσεις (CEBIT, Esprit technical Week, Δ.Ε.Θ).
Ναδάλης Κώστας Ιδρυτής εταιρίας γλωσσικής τεχνολογίας TMServe
Ο Κώστας Ναδάλης γεννήθηκε στην Αθήνα το 1959 και σπούδασε μαθηματικά και φυσική στην Αγγλία και στη συνέχεια αρχαιολογία, αρχαία ιστορία και πληροφορική στον Καναδά, στο πανεπιστήμιο McGill. Ξεκίνησε την καριέρα του στην ORCO το 1987 ως ειδικός πληροφορικής και σύντομα ως βασικό στέλεχος σε σειρά έργων πληροφορικής, ανάπτυξης λογισμικού και μελετών οργάνωσης και μηχανοργάνωσης για μεγάλους πελάτες. Από το 1989 ασχολείται με την εκπόνηση μεγάλων έργων ελληνοποίησης λογισμικού αρχικά ως υπεύθυνος έργου για έργα της ΙΒΜ και στην συνέχεια και για άλλους μεγάλους πελάτες όπως η Microsoft και η Oracle. Παράλληλα ασχολείται με τη χρήση, υποστήριξη, εκπαίδευση και ανάπτυξη εργαλείων υποβοήθησης της μετάφρασης και διαχείρισης μεταφραστικών έργων. Διετέλεσε διευθυντής του Τμήματος Τεχνικής Μετάφρασης και Ελληνοποίησης Λογισμικού, μέτοχος και αντιπρόεδρος της ORCO A.E. μέχρι το 2007. Ενώ σήμερα προσφέρει τις υπηρεσίες του ως ανεξάρτητος τεχνικός σύμβουλος, αναλυτής, προγραμματιστής και εκπαιδευτής στον ευρύτερο χώρο της μετάφρασης και τοπικής προσαρμογής στην Ελλάδα και το εξωτερικό μέσω της προσωπικής του εταιρίας, της TMServe. Διδάσκει SDL Trados στην ORCO και Διαχείριση Μεταφραστικών Έργων στη meta|φραση.

Γαβριηλίδου Μαρία Γλωσσολόγος, Ινστιτούτο Επεξεργασίας του Λόγου / Ερευνητικό Κέντρο "Αθηνά"

Η Μαρία Γαβριηλίδου είναι γλωσσολόγος και εργάζεται στο Ινστιτούτο Επεξεργασίας του Λόγου, στα ερευνητικά πεδία της Λεξικογραφίας (Έντυπης και Υπολογιστικής), της Ορολογίας, της Επεξεργασίας γλωσσικών πόρων και των Μεταδεδομένων τεκμηρίωσης γλωσσικών πόρων. Έχει εκτεταμένη εμπειρία στο σχεδιασμό, την κατασκευή και την επεξεργασία γλωσσικών πόρων (σωμάτων κειμένων, υπολογιστικών λεξικών, ορολογικών πόρων και θησαυρών) και στον σχεδιασμό και τη χρήση μεταδεδομένων για την περιγραφή και τεκμηρίωση των γλωσσικών πόρων. Έχει διδάξει Υπολογιστική Λεξικογραφία και Θεωρία λεξικογραφίας και Εφαρμογές σε διαπανεπιστημιακά Προγράμματα Μεταπτυχιακών Σπουδών του Πανεπιστημίου Αθηνών και του ΕΜΠ. Έχει ασχοληθεί με τη σύνταξη έντυπων και ηλεκτρονικών πολυμεσικών λεξικών και στην κατάρτιση εκπαιδευτικού υλικού για τη διδασκαλία της ελληνικής ως μητρικής. Έχει δημοσιεύσεις σε ελληνικά και διεθνή συνέδρια, περιοδικά και επιστημονικά βιβλία.

Προκοπίδης Προκόπης Επιστημονικός συνεργάτης ΙΕΛ / Ε.Κ. "Αθηνά"
.

Ο Προκόπης Προκοπίδης είναι επιστημονικός συνεργάτης του Ινστιτούτου Επεξεργασίας του Λόγου από το 1998. Είναι πτυχιούχος του Τμήματος Αγγλικών Σπουδών της Φιλοσοφικής Σχολής του Παν. Αθηνών και είναι κάτοχος μεταπτυχιακού διπλώματος στην Υπολογιστική Γλωσσολογία από το Παν. Του Essex. Έχει συμμετάσχει σε ελληνικά και ευρωπαϊκά ερευνητικά προγράμματα που σχετίζονται με την επεξεργασία φυσικής γλώσσας, τη μηχανική μετάφραση και την εξαγωγή πληροφορίας. Στα ενδιαφέροντά του περιλαμβάνεται ο σχεδιασμός και η δημιουργία χειρωνακτικά επισημειωμένων γλωσσικών πόρων, αλλά και η ανάπτυξη και εφαρμογή τεχνολογιών για την αυτόματη επισημείωση κειμένων, με εστίαση στην ελληνική γλώσσα.

Κατσούρος Βασίλης Ερευνητής Α’ ΙΕΛ/Ε.Κ. Αθηνά
Ο Βασίλειος Κατσούρος αποφοίτησε το 1992 από το τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ του Εθνικού Μετσόβιου Πολυτεχνείου. Το 1993 έλαβε με διάκριση το μεταπτυχιακό δίπλωμα Μάστερ στις Επικοινωνίες και την Επεξεργασία Σήματος από το ImperialCollege του Πανεπιστημίου του Λονδίνου και το 1997 το διδακτορικό του από το ίδιο Πανεπιστήμιο. Από το 1998 εργάζεται στο Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου "Αθηνά" όπου σήμερα είναι Ερευνητής Α'. Ο κ. Κατσούρος έχει ασχοληθεί σε Ευρωπαϊκά και εθνικά ερευνητικά και αναπτυξιακά προγράμματα με αντικείμενο τεχνολογίες ευφυών συστημάτων και ανάλυσης πολυμεσικής πληροφορίας. Τα ερευνητικά του ενδιαφέροντα περιλαμβάνουν την Ψηφιακή Επεξεργασία Σήματος, Πιθανότητες και Στοχαστικές Ανελίξεις, Στατιστική Ανάλυση, Αναγνώριση Προτύπων και Μηχανική Μάθηση. Είναι μέλος του IEEE (InstituteofElectricalandElectronicEngineers) από το 1992, του Τεχνικού Επιμελητηρίου της Ελλάδας (ΤΕΕ) από το 1992 και της AssociationofComputingMachinery (ACM) από το 1999. Από το 1999 είναι πιστοποιημένος ειδικός διαπραγματευτής (marketmaker/trader) του Χρηματιστηρίου Παραγώγων Αθηνών.

Τσιάκουλης Πύρρος Διευθυντής Τεχνολογίας innoetics
Ο ΠύρροςΤσιάκουλης είναι συνιδρυτής και Διευθυντής Τεχνολογίας της εταιρίας innoetics, μιας start-up με αριστεία στην τεχνολογία συνθετικής ομιλίας. Έχειεργαστείωςμεταδιδακτορικόςερευνητήςστο Machine Intelligence Laboratory, Cambridge University Engineering Department (2011 – 2014). Εισήλθε στο χώρο της έρευνας και τεχνολογίας φωνής το 2000 ως προπτυχιακός υπότροφος στο Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ), και συνέχισε ως επιστημονικός συνεργάτης στην ομάδα Σύνθεσης Φωνής του ΙΕΛ/ ΕΚ ΑΘΗΝΑ. Έχει επίσης συνεργαστεί με την ομάδα του Εργαστηρίου Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων τους Εθνικού Μετσόβιου Πολυτεχνείου (ΕΜΠ), καθώς επίσης και με το Εργαστήριο Πληροφορίας και Δικτύων του Πολυτεχνείου Κρήτης. Είναι κάτοχος διπλώματος (2003) και διδακτορικού (2010) από την Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΕΜΠ.

Πιπερίδης Στέλιος Ερευνητής, Ινστιτούτο Επεξεργασίας Λόγου / ΕΚ «Αθηνά»
Ο Στέλιος Πιπερίδης είναι υπεύθυνος του Τμήματος Επεξεργασίας Φυσικής Γλώσσας και Εξαγωγής Γνώσης του Ινστιτούτου Επεξεργασίας Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου «Αθηνά». Διευθυντής της Ελληνικής Ερευνητικής Υποδομής Clarin EL, μέλος της εκτελεστικής επιτροπής των δικτύων ELRC, ΜΕΤΑ-ΝΕΤ, FLaReNet και επιστημονικός υπεύθυνος της υποδομής META-SHARE. Πρόεδρος του European LanguageResourcesAssociation, ELRA, (2008-2012), μέλος της Επιτροπής Προγράμματος των συνεδρίων LREC (2006-σήμερα), απόφοιτος της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών ΗΥ του Εθνικού Μετσοβίου Πολυτεχνείου (Dipl. Ing) καιτου Imperial College of Science Τechnology and Medicine, University of London.(MSc, DIC) και υπεύθυνος ευρωπαϊκών ερευνητικών προγραμμάτων του ΙΕΛ/ΕΚ Αθηνά. Υπήρξε επιστημονικός υπεύθυνος των έργων Translearn/LRE, Musa/IST και RevealThis/IST, και ηγήθηκε της συμμετοχής του ΙΕΛ σε περισσότερα από 25 έργα Ε&Α στις περιοχές της επεξεργασίας μονο/πολύγλωσσης και πολυμεσικής πληροφορίας. Τα ερευνητικά του ενδιαφέροντα περιλαμβάνουν στατιστικές και επαγωγικές μεθόδους στην επεξεργασία και κατανόηση φυσικής γλώσσας, γλωσσικούς πόρους και αυτόματη εξαγωγή γλωσσικής γνώσης, καθώς και επεξεργασία πολυγλωσσικής πληροφορίας, μηχανικής μετάφρασης και φιλοσοφίας της γλώσσας. Έχει δημοσιεύσει περισσότερα από 130 άρθρα σε διεθνή επιστημονικά βιβλία, περιοδικά και πρακτικά συνεδρίων.

Σχετικές ομιλίες