Bodossaki Lectures on Demand
ΙΔΡΥΜΑ ΜΠΟΔΟΣΑΚΗ

Scalable Machine Learning on Large Sequence Collections

Παλπάνας Θέμης, Γιαννακόπουλος Γιώργος

4 Σεπτεμβρίου 2020

ΟΜΙΛΙΕΣ
EXIT FULL SCREEN
ΔΙΑΡΚΕΙΑ 01:07:56 ΠΡΟΒΟΛΕΣ 35

Έχει δημιουργηθεί μια ολοένα και πιο επιτακτική ανάγκη, σε πολλές εφαρμογές διαφόρων τομέων, για την ανάπτυξη τεχνικών ικανών να αναλύουν πολύ μεγάλες συλλογές ακολουθιών, ή σειρών δεδομένων. Παραδείγματα τέτοιων εφαρμογών εμφανίζονται σε επιστημονικούς, κατασκευαστικούς και κοινωνικούς κλάδους, όπου σε πολλές περιπτώσεις χρειάζεται να εφαρμοστούν τεχνικές μηχανικής μάθησης για την εξαγωγή γνώσης (knowledge extraction). Δεν είναι ασυνήθιστο αυτές οι εφαρμογές να χρησιμοποιούν αριθμούς σειρών δεδομένων που εκτείνονται από εκατοντάδες εκατομμύρια έως δισεκατομμύρια, οι οποίοι συχνά δεν αναλύονται με κάθε λεπτομέρεια λόγω του μεγάλου μεγέθους τους. Ωστόσο, καμία υπάρχουσα λύση διαχείρισης δεδομένων [όπως σχεσιακές βάσεις δεδομένων, κάθετη αποθήκευση (column stores), array databases και συστήματα διαχείρισης χρονοσειρών] δεν μπορεί να προσφέρει εγγενή υποστήριξη για ακολουθίες και για τους αντίστοιχους χειριστές που είναι απαραίτητοι για πολύπλοκες αναλύσεις.

Ο ομιλητής υποστηρίζει την ανάγκη να μελετηθούν η θεωρία και τα θεμέλια της διαχείρισης ακολουθιών για ακολουθίες μεγάλων δεδομένων και να δημιουργηθούν αντίστοιχα συστήματα που θα επιτρέψουν την κλιμακούμενη διαχείριση και ανάλυση πολύ μεγάλων συλλογών ακολουθιών. Ο ομιλητής περιγράφει τις τελευταίες προσπάθειες στο σχεδιασμό τεχνικών για την ευρετηρίαση και ανάλυση πραγματικά τεράστιων συλλογών σειρών δεδομένων που θα επιτρέψουν στους επιστήμονες να πραγματοποιούν πολύπλοκες αναλύσεις των δεδομένων τους. Τέλος, ο ομιλητής παρουσιάζει ανοιχτές ερευνητικές κατευθύνσεις στον τομέα της διαχείρισης μεγάλων ακολουθιών.

Παλπάνας Θέμης Senior Member, French University Institute (IUF)

Ο Θέμης Παλπάνας είναι Ανώτερο Μέλος του Institut Universitaire de France (IUF) και Καθηγητής Επιστήμης Υπολογιστών στο Université de Paris (Γαλλία), όπου είναι διευθυντής του Data Intelligence Institute of Paris (diiP), και διευθυντής του data management group, diNo. Είναι κάτοχος BS από το Εθνικό Μετσόβιο Πολυτεχνείο, και MSc και PhD από το Πανεπιστήμιο του Τορόντο του Καναδά. Προηγουμένως κατείχε θέσεις στο University of California at Riverside, στο University of Trento και στο IBM T.J. Watson Research Center, και ήταν επισκέπτης στο Microsoft Research, και το Κέντρο Ερευνών IBM Almaden. Τα ενδιαφέροντά του περιλαμβάνουν προβλήματα που σχετίζονται με την επιστήμη δεδομένων (ανάλυση μεγάλων δεδομένων και εφαρμογές μηχανικής μάθησης). Είναι συγγραφέας εννέα διπλωμάτων ευρεσιτεχνίας των ΗΠΑ, τρία από τα οποία έχουν εφαρμοστεί σε προϊόντα διαχείρισης εμπορικών δεδομένων που έχουν ηγετική θέση σε παγκόσμιο επίπεδο. Έχει λάβει τρία Best Paper awards και το IBM Shared University Research (SUR) Award. Επί του παρόντος, εργάζεται στο VLDB Endowment Board of Trustees, ως Editor in Chief για το BDR Journal, Associate Editor για το TKDE και τα περιοδικά IDA, καθώς και στο Editorial Advisory Board του περιοδικού IS, και στο Editorial Board του περιοδικού TLDKS. Ήταν General Chair του VLDB 2013, Associate Editor του VLDB 2019 και 2017, Research PC Vice Chair του ICDE 2020, και Workshop Chair των EDBT 2016, ADBIS 2013 και ADBIS 2014, General Chair του PDA@IOT International Workshop (που πραγματοποιήθηκε παράλληλα με το VLDB 2014), και General Chair του Event Processing Symposium 2009.

Γιαννακόπουλος Γιώργος Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών, ΕΚΕΦΕ "Δημόκριτος" - Συνιδρυτής & CEO, SciFY

Ο Γιώργος Γιαννακόπουλος είναι συνιδρυτής και CEO της SciFY καθώς και συνεργαζόμενος ερευνητής στο Εργαστήριο Μηχανικής Γνώσης και Λογισμικού (SKEL) του ΕΚΕΦΕ "Δημόκριτος".

Απόφοιτος Πληροφορικής του ΕΚΠΑ, πήρε το διδακτορικό του στην Τεχνητή Νοημοσύνη από το ΤΜΠ & ΕΣ του Πανεπιστημίου Αιγαίου. Ασχολείται ερευνητικά (μεταξύ άλλων) με την επεξεργασία φυσικής γλώσσας, τη μηχανική μάθηση, την εξόρυξη δεδομένων, το σημασιολογικό ιστό, τα προσαρμοστικά συστήματα και τη βιοπληροφορική. Έχει εργαστεί σε πληθώρα ερευνητικών έργων (OntoSum, OKKAM, SYNC3, NOMAD, SemaGrow), είναι ο οργανωτής της κοινότητας MultiLing (Multilingual Multi-document Summarization) και των αντίστοιχων workshops (TAC 2011, ACL 2013). Παράλληλα έχει εργαστεί πάνω από 15 χρόνια στη βιομηχανία της πληροφορικής.

Σχετικές ομιλίες