Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Γλωσσική τεχνολογία 2

No description
by

Marianne Katsoyannou

on 27 April 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Γλωσσική τεχνολογία 2

5.000 χρόνια αργότερα...
Aνάμεσα στην πήλινη πινακίδα
και στον σημερινό ορθογραφικό διορθωτή...
Εφαρμογές και προϊόντα
Ήταν άραγε τυχαία γύρω στο 1980 η επιτυχία του Ιππότη της Ασφάλτου που κουβέντιαζε με τον Κιτ, το νοήμον αυτοκίνητο;



Τεχνολογικές και γλωσσολογικές συνιστώσες
Σύνθεση και αναγνώριση φωνής
Ή μήπως κέρδισε το κοινό ως προπομπός της πραγματικότητας;
υπαγόρευση αντί για πληκτολόγηση
ανάγνωση κειμένου π.χ. για τυφλούς
αναγνώριση του "αποτυπώματος" της φωνής
παραγγελίες εισιτηρίων, αιτήσεις σε υπηρεσίες, πληρωμές λογαριασμών, ψώνια... όπως (παλιά!) από το τηλέφωνο

Αναζήτηση γραμματικής πληροφορίας, παραγωγή γενικών και ειδικών (ορολογικών) λεξικών, βάσεων δεδομένων και άλλων έργων αναφοράς.
Αλληλεπιδραστική χρήση, π.χ. με εργαλεία πολλαπλής αναζήτησης και/ή με τράπεζες δεδομένων, παράλληλα κείμενα, «κοινοπραξίες» βάσεων που συνεργάζονται για να παίρνει ο χρήστης όλες τις διαθέσιμες απαντήσεις υποβάλλοντας την ερώτησή του μία και μόνο φορά.
Γλωσσική τεχνολογία
Μαριάννα

Κατσογιάννου
Πανεπιστήμιο Κύπρου
Cyling, Κυπριακή Εταιρεία Γλωσσολογίας

Η ιστορία
κάθε γλώσσας
αρχίζει με τα γραπτά
της μνημεία, δηλαδή με τις αποδείξεις για τη σύνδεσή της με την τεχνολογία.
Γλωσσική τεχνολογία λέγεται η επεξεργασία κάθε είδους γλωσσικών δεδομένων με ηλεκτρονικά μέσα και εργαλεία, κυρίως με προγράμματα Η/Υ και λογισμικά συστήματα.
...μεσολαβούν πολλές χιλιετίες. Η γλωσσική τεχνολογία όμως είναι παιδί της δεκαετίας του 1950, στην οποία κυρίως αναπύχθηκε η δυνατότητα για ευκολότερη, ταχύτερη, ακριβέστερη επεξεργασία μεγάλων όγκων δεδομένων - και αυτό χάρη στην τεχνολογία των Η/Υ.
Μελέτη και περιγραφή των μηχανισμών του νου στους οποίους βασίζεται η κατανόηση και η παραγωγή λόγου.
Αναπαράσταση της γλωσσολογικής γνώσης.
Ανάπτυξη υπολογιστικών μοντέλων για επεξεργασία των πληροφοριών που εκφράζονται μέσω της γλώσσας.
Ανάπτυξη λογισμικών προγραμμάτων και συστημάτων για την επεξεργασία των γλωσσικών δεδομένων.


Μονόγλωσσοι και πολύγλωσσοι γλωσσικοί πόροι
Σήμερα, οι τεχνολογίες της φωνής είναι τόσο εξελιγμένες που κάνουν ακόμη και τα... ψάρια να μιλάνε. Αμφιβάλλετε; Για δείτε εδώ...
Πώς δουλεύει η γλωσσική τεχνολογία;
Με μία πρόταση: δίνουμε στον υπολογιστή ως "είσοδο" ένα γλωσσικό δεδομένο (π.χ. πληκτρολογούμε μία λέξη) και παίρνουμε ως απάντηση, ως "έξοδο", ένα
νέο
δεδομένο, π.χ. τη διόρθωση της λέξης αν ήταν ανορθόγραφη ή την επιβεβαίωση της ορθογραφίας αν ήταν σωστή.
Ως μεθοδολογία, ναι. Υπάρχουν όμως εκατοντάδες διαφορετικές εφαρμογές: υπολογιστική λεξικογραφία, αυτόματη μετάφραση, αυτόματη περίληψη, σύνθεση και αναγνώριση φωνής, εντοπισμός και εξαγωγή πληροφορίας από κείμενο, κατηγοριοποίηση και ταξινόμηση κειμένων, επικοινωνία ανθρώπου-μηχανής με φυσική γλώσσα...
Κι αυτό είναι όλο;
Συλλογή δεδομένων: οι γλωσσικοί πόροι
Ένας σημαντικός τομέας που είναι σε συνεχή ανάπτυξη, αφορά τη δημιουργία γλωσσικών πόρων. Οι γλωσσικοί πόροι δεν είναι απλώς όγκοι από δεδομένα, με την έννοια ότι δεν είναι τυχαίες συλλογές, συνονθυλεύματα λέξεων και κειμένων, αλλά
δομημένα
έργα: χάρη στη δομή τους γίνεται δυνατή η υπολογιστική επεξεργασία και, μέσω αυτής, η αξιοποίηση κάθε έργου από το μέσο χρήστη - δηλαδή από εμάς. Οι πόροι είναι λοιπόν οργανωμένες πηγές γνώσης που χρησιμεύουν στην αποτελσματικότερη μελέτη, επεξεργασία και μελέτη των γλωσσικών δεδομένων.
www.tlg.uci.edu
Το Thesaurus Linguae Graecae (TLG) στο Πανεπιστήμιο Irvine (Καλι-φόρνια), έχει ψηφιοποιήσει όλα τα κείμενα της ελληνικής γλώσσας από τον Όμηρο έως την πτώση της Κωνσταντινούπολης.
www.hnc.ilsp.gr
Ο Εθνικός Θησαυρός της Ελληνικής Γλώσσας (ΕΘΕΓ), με περισσότερες από 47.000.000 λέξεις, από κείμενα γραμμένα από το 1974 και μετά.
Κύπρος
Tο αρχείο προφορικής παράδοσης του Κέντρου Επιστημονικών Ερευνών στην Κύπρο περιέχει 7046 ψηφιοποιημένες κασέτες με συνεντεύξεις από την περίοδο 1960-2002.
http://hnc.ilsp.gr/find.asp
Παραγωγή κειμένου διαφόρων ειδών:
αυτόματη μετάφραση (όχι, όχι όπως στο γκουγκλ!!!)
,
τελευταίως και από προφορικό λόγο
περιλήψεις με υψηλή αξιοπιστία
συγγραφή κειμένου: αποτελέσματα αγώνων, δελτία καιρού...
περιγραφή προϊόντων, κάθε είδους αντικειμένων
απάντηση σε μηνύματα
Συστήματα ερωταποκρίσεων (π.χ. αναζήτηση πληροφοριών σε άρθρα) και προφορικών διαλόγων (π.χ. κρατήσεις εισιτηρίων, διάλογοι πλοήγησης σε αυτοκίνητο).
Και πολλά άλλα...
αναγνώριση συγγραφέα: μητρική γλώσσα, ηλικία, φύλο, ταυτότητα
αναγνώριση χαρακτήρων: μηχανές που διαβάζουν ταχυδρομικές διευθύνσεις, έξυπνες μηχανές αναζήτησης
αντιστοίχιση κειμένων, π.χ. βιογραφικών με αγγελίες ευρέσεως εργασίας
μετατροπή των γκρίκλις σε ελληνικούς χαρακτήρες
και πολλά άλλα

http://speech.ilsp.gr/greeklish/
http://lexcy.library.ucy.ac.cy/
http://www.acapela.tv/en/talking-card/Fish/
2
Κάθε είδος γραφής είναι τεχνολογία με την έννοια ότι απαιτεί χρήση εργαλείων και δεξιοτήτων που παρεμβάλλονται ανάμεσα στην ανθρώπινη σκέψη και στην αποτύπωσή της σε κάποιο μέσο.
Ένας πιο τεχνικός ορισμός θα ήταν να πούμε ότι γλωσσική τεχνολογία είναι η επεξεργασία της πληροφορίας που εκφράζεται με γλωσσικά μέσα, όταν γίνεται με ηλεκτρονικό τρόπο. Ως επιστημονικός κλάδος, η γλωσσική τεχνολογία ασχολείται με την ανάπτυξη μοντέλων και συστημάτων για το σκοπό αυτό.

Το 1997, ο υπερυπολογιστής Deep Blue κατατρόπωσε τον παγκόσμιο πρωταθλητή στο σκάκι. Η ιστορική αυτή στιγμή περιγράφεται στο βραβευμένο ντοκιμαντέρ
Game Over: Kasparov and the Machine
, ενώ η IBM διατηρεί ακόμα μια ιστοσελίδα για το γεγονός.

Στη δεκαετία του 1940, ο Άλαν Τούρινγκ δημιούργησε τον πρόδρομο των σημερινών υπολογιστών.
Η γλωσσική τεχνολογία άλλοτε μας είναι οικεία και άλλοτε κρύβεται μέσα σε πολύπλοκες εφαρμογές, άγνωστες για τον πολύ κόσμο.

Το 2011, το σύστημα Watson νίκησε τους πρωταθλητές του τηλεπαιχνιδιού ερωτήσεων Jeopardy! και κέρδισε τον τελικό βρίσκοντας τη λύση σε γρίφους όπως «Αυτά που κατηγορεί ένας φτωχός εργάτης».
Full transcript