Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Γλωσσική τεχνολογία 2

No description
by

Marianne Katsoyannou

on 26 September 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Γλωσσική τεχνολογία 2

5.000 χρόνια αργότερα...
Aνάμεσα στην πήλινη πινακίδα
και στον σημερινό ορθογραφικό διορθωτή...
Εφαρμογές και προϊόντα
Ήταν άραγε τυχαία γύρω στο 1980 η επιτυχία του Ιππότη της Ασφάλτου που κουβέντιαζε με τον Κιτ, το νοήμον αυτοκίνητο;



Τεχνολογικές και γλωσσολογικές συνιστώσες
Σύνθεση και αναγνώριση φωνής
Ή μήπως κέρδισε το κοινό ως προπομπός της πραγματικότητας;
υπαγόρευση αντί για πληκτολόγηση
ανάγνωση κειμένου π.χ. για τυφλούς
αναγνώριση του "αποτυπώματος" της φωνής
παραγγελίες εισιτηρίων, αιτήσεις σε υπηρεσίες, πληρωμές λογαριασμών, ψώνια... όπως (παλιά!) από το τηλέφωνο

Αναζήτηση γραμματικής πληροφορίας, παραγωγή γενικών και ειδικών (ορολογικών) λεξικών, βάσεων δεδομένων και άλλων έργων αναφοράς.
Αλληλεπιδραστική χρήση, π.χ. με εργαλεία πολλαπλής αναζήτησης και/ή με τράπεζες δεδομένων, παράλληλα κείμενα, «κοινοπραξίες» βάσεων που συνεργάζονται για να παίρνει ο χρήστης όλες τις διαθέσιμες απαντήσεις υποβάλλοντας την ερώτησή του μία και μόνο φορά.
Γλωσσική τεχνολογία
Μαριάννα

Κατσογιάννου
Πανεπιστήμιο Κύπρου
Cyling, Κυπριακή Εταιρεία Γλωσσολογίας

Η ιστορία
κάθε γλώσσας
αρχίζει με τα γραπτά
της μνημεία, δηλαδή με τις αποδείξεις για τη σύνδεσή της με την τεχνολογία.
Γλωσσική τεχνολογία λέγεται η επεξεργασία κάθε είδους γλωσσικών δεδομένων με ηλεκτρονικά μέσα και εργαλεία, κυρίως με προγράμματα Η/Υ και λογισμικά συστήματα.
...μεσολαβούν πολλές χιλιετίες. Η γλωσσική τεχνολογία όμως είναι παιδί της δεκαετίας του 1950, στην οποία κυρίως αναπύχθηκε η δυνατότητα για ευκολότερη, ταχύτερη, ακριβέστερη επεξεργασία μεγάλων όγκων δεδομένων - και αυτό χάρη στην τεχνολογία των Η/Υ.
Η γλωσσική τεχνολογία άλλοτε μας είναι οικεία και άλλοτε κρύβεται μέσα σε πολύπλοκες εφαρμογές, άγνωστες για τον πολύ κόσμο.

αυτόματη μετάφραση (όχι, όχι όπως στο γκουγκλ!!!)
παραγωγή περίληψης με υψηλή αξιοπιστία
συγγραφή κειμένου: αποτελέσματα αγώνων, δελτία καιρού...
αναγνώριση συγγραφέα: μητρική γλώσσα, ηλικία, φύλο, ταυτότητα
αναγνώριση χαρακτήρων: μηχανές που διαβάζουν ταχυδρομικές διευθύνσεις, έξυπνες μηχανές αναζήτησης
αντιστοίχιση κειμένων, π.χ. βιογραφικών με αγγελίες ευρέσεως εργασίας
μετατροπή των γκρίκλις σε ελληνικούς χαρακτήρες
και πολλά άλλα

Μελέτη και περιγραφή των μηχανισμών του νου στους οποίους βασίζεται η κατανόηση και η παραγωγή λόγου.
Αναπαράσταση της γλωσσολογικής γνώσης.
Ανάπτυξη υπολογιστικών μοντέλων για επεξεργασία των πληροφοριών που εκφράζονται μέσω της γλώσσας.
Ανάπτυξη λογισμικών προγραμμάτων και συστημάτων για την επεξεργασία των γλωσσικών δεδομένων.


Μονόγλωσσοι και πολύγλωσσοι γλωσσικοί πόροι
Σήμερα, οι τεχνολογίες της φωνής είναι τόσο εξελιγμένες που κάνουν ακόμη και τα... ψάρια να μιλάνε. Αμφιβάλλετε; Για δείτε εδώ...
Πώς δουλεύει η γλωσσική τεχνολογία;
Με μία πρόταση: δίνουμε στον υπολογιστή ως "είσοδο" ένα γλωσσικό δεδομένο (π.χ. πληκτρολογούμε μία λέξη) και παίρνουμε ως απάντηση, ως "έξοδο", ένα
νέο
δεδομένο, π.χ. τη διόρθωση της λέξης αν ήταν ανορθόγραφη ή την επιβεβαίωση της ορθογραφίας αν ήταν σωστή.
Ως μεθοδολογία, ναι. Υπάρχουν όμως εκατοντάδες διαφορετικές εφαρμογές: υπολογιστική λεξικογραφία, αυτόματη μετάφραση, αυτόματη περίληψη, σύνθεση και αναγνώριση φωνής, εντοπισμός και εξαγωγή πληροφορίας από κείμενο, κατηγοριοποίηση και ταξινόμηση κειμένων, επικοινωνία ανθρώπου-μηχανής με φυσική γλώσσα...
Κι αυτό είναι όλο;
Συλλογή δεδομένων: οι γλωσσικοί πόροι
Ένας σημαντικός τομέας που είναι σε συνεχή ανάπτυξη, αφορά τη δημιουργία γλωσσικών πόρων. Οι γλωσσικοί πόροι δεν είναι απλώς όγκοι από δεδομένα, με την έννοια ότι δεν είναι τυχαίες συλλογές, συνονθυλεύματα λέξεων και κειμένων, αλλά
δομημένα
έργα: χάρη στη δομή τους γίνεται δυνατή η υπολογιστική επεξεργασία και, μέσω αυτής, η αξιοποίηση κάθε έργου από το μέσο χρήστη - δηλαδή από εμάς. Οι πόροι είναι λοιπόν οργανωμένες πηγές γνώσης που χρησιμεύουν στην αποτελσματικότερη μελέτη, επεξεργασία και μελέτη των γλωσσικών δεδομένων.
www.tlg.uci.edu
Το Thesaurus Linguae Graecae (TLG) στο Πανεπιστήμιο Irvine (Καλι-φόρνια), έχει ψηφιοποιήσει όλα τα κείμενα της ελληνικής γλώσσας από τον Όμηρο έως την πτώση της Κωνσταντινούπολης.
www.hnc.ilsp.gr
Ο Εθνικός Θησαυρός της Ελληνικής Γλώσσας (ΕΘΕΓ), με περισσότερες από 47.000.000 λέξεις, από κείμενα γραμμένα από το 1974 και μετά.
Κύπρος
Tο αρχείο προφορικής παράδοσης του Κέντρου Επιστημονικών Ερευνών στην Κύπρο περιέχει 7046 ψηφιοποιημένες κασέτες με συνεντεύξεις από την περίοδο 1960-2002.
http://hnc.ilsp.gr/find.asp
http://speech.ilsp.gr/greeklish/
http://lexcy.library.ucy.ac.cy/
http://www.acapela.tv/en/talking-card/Fish/
2
Κάθε είδος γραφής είναι τεχνολογία με την έννοια ότι απαιτεί χρήση εργαλείων και δεξιοτήτων που παρεμβάλλονται ανάμεσα στην ανθρώπινη σκέψη και στην αποτύπωσή της σε κάποιο μέσο.
Τι μπορεί να κάνει για μας
η γλωσσική τεχνολογία;
Ένα σωρό πράγματα από τα οποία άλλα μας είναι οικεία, όπως η αυτόματη διόρθωση κειμένων και άλλα όχι.
Μηχανική μετάφραση, πλέον και προφορικού λόγου.
Διήθηση μηνυμάτων (π.χ. φίλτρα spam, tweets).
Εξαγωγή πληροφοριών ("εξόρυξη γνώσης") από κείμενα.
Συστήματα ερωταποκρίσεων (π.χ. αναζήτηση
πληροφοριών σε άρθρα).
Συστήματα προφορικών διαλόγων (π.χ. κρατήσεις
εισιτηρίων, διάλογοι πλοήγησης σε αυτοκίνητο).
Αυτόματης παραγωγής κειμένων (π.χ.
περιγραφές προϊόντων ή εκθεμάτων σε πολλές γλώσσες).
Ένας πιο τεχνικός ορισμός θα ήταν να πούμε ότι γλωσσική τεχνολογία είναι η επεξεργασία πληροφορίας που εκφράζεται με γλωσσικά μέσα, όταν γίνεται με ηλεκτρονικά μέσα. Ως επιστημονικός κλάδος, ασχολείται με την ανάπτυξη μοντέλων και συστημάτων για το σκοπό αυτό.

Συστήματα ερωταποκρίσεων
• Το σύστημα Watson της IBM κέρδισε το 2011 τον τελικό
του τηλεπαιχνιδιού ερωταποκρίσεων Jeopardy!
o Υπάρχουν στον Ιστό πολλά βίντεο για το σύστημα.
o Βλ. π.χ.
Στη δεκαετία του 1940, ο Άλαν Τούρινγκ δημιούργησε τον πρόδρομο των σημερινών υπολογιστών.
Full transcript