Εισήγηση: Γλώσσα και νέες μηχανές _μηχανοποίηση της γλώσσας

Σήμερα φόρεσα ένα
ζεστό κόκκινο αίμα
σήμερα οι άνθρωποι μ’ αγαπούν
μια γυναίκα μου χαμογέλασε
ένα κορίτσι μου χάρισε ένα κοχύλι
ένα παιδί μου χάρισε ένα σφυρί

Σήμερα γονατίζω στο πεζοδρόμιο
καρφώνω πάνω στις πλάκες
τα γυμνά άσπρα ποδάρια των περαστικών
είναι όλοι τους δακρυσμένοι
όμως κανείς δεν τρομάζει
όλοι μείναν στις θέσεις που πρόφτασαν
είναι όλοι τους δακρυσμένοι
όμως κοιτάζουν τις ουράνιες ρεκλάμες
και μια ζητιάνα που πουλάει τσουρέκια
στον ουρανό

Δύο άνθρωποι ψιθυρίζουν
τι κάνει, την καρδιά μας καρφώνει;
ναι, την καρδιά μας καρφώνει
ώστε λοιπόν είναι ποιητής

Μίλτος Σαχτούρης, Τα δώρα

 

Περιγράφοντας ένα πέρασμα

Εισαγωγή

«Τη ‘γλώσσα’ μπορούμε να την προσεγγίσουμε μόνο μέσω του ‘λόγου’, ξεπερνώντας με ένα βήμα αφαίρεσης την ατομική ποικιλία, θα μας πει ο Saussure. […] Σκοπός της θεωρητικής γλωσσολογίας είναι να διατυπώσει μια θεωρία της δομής και των λειτουργιών της γλώσσας. Αντίθετα, η εφαρμοσμένη ενδιαφερόταν πάντοτε για τις πρακτικές εφαρμογές που θα μπορούσε να έχει η θεωρητική έρευνα της γλώσσας και των γλωσσών – μέχρι να αρχίσει να αναπτύσσει και αυτή τη δική της θεωρία.»

Αριστοτέλειο Πανεπιστήμιο, Γενική Γλωσσολογία

Με την εμφάνιση των υπολογιστών δημιουργείται ήδη από πολύ νωρίς η ανάγκη για μία computer compatible γλώσσα, δηλαδή για μία εφαρμόσιμη στη νέα μηχανή γλωσσολογική θεωρία. Πρέπει άμεσα ο ίδιος ο ανθρώπινος λόγος να χωρέσει στη μηχανή, να διαμεσολαβείται από αυτήν ο διάλογος, να αναπαράγεται από την μηχανή, διαδικασίες που σήμερα ως χρήστες βιώνουμε ως αυτόματες και μαγικές. Τέτοια παραδείγματα ξεκινούν από το word και τα chat και φτάνουν μέχρι τους αυτόματους πωλητές. Για τις ανάγκες αυτές αρχίζει να γεννάται περίπου τη δεκαετία του ’50 ένας καινούριος επιστημονικός κλάδος για τη γλώσσα, η υπολογιστική γλωσσολογία, για να φέρει εις πέρας όλα τα παραπάνω και πολλά ακόμα. Αυτός ο κλάδος δεν εμφανίστηκε από το πουθενά, παρά βασίστηκε στις ήδη θεμελιωμένες θεωρίες για τη γλώσσα, αρχίζοντας σιγά-σιγά να χτίζει κι αυτός τη δική του θεωρία.

Με την εισήγηση αυτή θα προσπαθήσουμε να περιγράψουμε πως η θεωρητική γλωσσολογία έθεσε τις βάσεις για την ανάπτυξη αυτού του σύγχρονου κλάδου, της εφαρμοσμένης υπολογιστικής γλωσσολογίας. Αυτό το πέρασμα θα το δούμε μέσα από το παράδειγμα δύο γλωσσολόγων που καλύψανε ο καθένας με τον τρόπο του βασική απόσταση για να χωρέσει η γλώσσα στη μηχανή, με χρονολογική απόκλιση έξι δεκαετιών ο ένας από τον άλλο. Τέλος, θα μιλήσουμε για την υπολογιστική γλωσσολογία αυτή καθαυτή, μέσα από τους ήδη εκπληρωμένους και μη στόχους της απέναντι στη γλώσσα.

Το θέμα που πιάνουμε σήμερα είναι μόνο ένα μικρό ερέθισμα για το ζήτημα της γλώσσας στις νέες μηχανές μέσα από δύο κεντρικές θεωρίες που προηγούνται της μηχανοποίησης της. Ως game over επιφυλασσόμαστε να κοιτάξουμε πολλές ακόμα από τις πτυχές και τις κλοπές στη γλώσσα στο μέλλον. Για τη διάσωση και του α-μήχανου λόγου λοιπόν, λίγα και ενδιαφέροντα και μόνο για αρχή.

Μηχανοποίηση της γλώσσας

Λίγα πρώτα λόγια

Ο κλάδος της υπολογιστικής γλωσσολογίας είναι που καθιστά εφικτή την μηχανοποίηση της γλώσσας. Όπου μηχανοποίηση της γλώσσας, ονομάζουμε το σύνολο της επεξεργασίας της ανθρώπινης γλώσσας με σκοπό αυτή να χωρέσει στις νέες μηχανές.

Οι υπολογιστικοί γλωσσολόγοι, οι ειδικοί που έχουν επωμιστεί το ανωτέρω έργο έπρεπε, και πρέπει ακόμα πιο εξονυχιστικά, να επιτύχουν συνοπτικά τρεις σκοπούς απέναντι στην ανθρώπινη γλώσσα.

Έπρεπε να την περιγράψουν, να την τεχνολογήσουν και τέλος, έπρεπε να δώσουν στην ίδια τη μηχανή τη δυνατότητα να «παράγει» λόγο. Για τα πρώτα δύο η υπολογιστική γλωσσολογία είχε ήδη μπροστά της μεγάλο κομμάτι έτοιμης δουλειάς από την ίδια την κλασική γλωσσολογία.

Συνοπτικά για αυτά τα τρία και για το πώς θα τα δούμε εδώ:

Η περιγραφή της γλώσσας έγινε πάνω σε ένα κλασσικό μοτίβο, που στο game over έχουμε συναντήσει παραπάνω από συχνά στις συζητήσεις μας. Την κατάτμηση της σε κομμάτια που μπορείς να κοιτάξεις έξω από τα συμφραζόμενα τους, με μία ταιηλορική διαδικασία. Αυτή η διαδικασία ξεκινά από πολύ νωρίς, από τα πρώτα ιερά τέρατα της θεωρητικής γλωσσολογίας. Εδώ θα στηρίξουμε πως η πιο βασική τομή για να γίνουν εφικτές περαιτέρω κατατμήσεις συντελείται με κεντρική τη θεωρία του Ferdinand de Saussure.

Η τεχνολόγηση της, δεν είναι παρά η προσπάθεια να ξαναγραφτεί αυτή με τέτοιο τρόπο, ώστε να μπορούν να την κατανοήσουν και να την μιμηθούν οι υπολογιστές. Σα μαθηματικά δηλαδή. Αργότερα αυτό έγινε εφικτό με το φιλτράρισμα της γλώσσας από αλγορίθμους που εφαρμόζονται τελικά στο σήμερα για ένα εύρος πολύ ειδικών σκοπών. Ξεκινά και αυτό από την θεωρητική γλωσσολογία. Ο πρώτος γλωσσολόγος που καταφέρνει να αντιμετωπίσει την γλώσσα κατά τέτοιο τρόπο, δηλαδή σαν καθαρά θετική επιστήμη είναι ο Noam Chomsky.

Τέλος, η παραγωγή της ήταν ένα άμεσο ζητούμενο εξαρχής, η δυνατότητα δηλαδή του ίδιου του υπολογιστή να παράγει λόγο κατανοητό σε τέτοιο βαθμό που ο άνθρωπος να μην μπορεί να καταλάβει τη διαφορά ανάμεσα στον ανθρώπινο λόγο και το λόγο της μηχανής. Σε αυτό δε θα σταθούμε καθόλου εδώ – και οι υπολογιστικοί γλωσσολόγοι έχουν ακόμα πολύ δρόμο να κάνουνε.

Καμμία από τις τρείς αυτές βασικές διαδικασίες δεν μπορεί να ειδωθεί ξεχωριστά όσον αφορά την εφαρμογή στις νέες μηχανές. Αντίθετα, τελούν και οι τρεις σε άμεση και ταυτόχρονη σχέση εξάρτησης αναμεταξύ τους, δεν εξελίσσονται πλέον γραμμικά, πρώτη δεύτερη και τρίτη, αλλά παράλληλα, μέσω του κλάδου της υπολογιστικής γλωσσολογίας , ή πιο ενδιαφέρον στα αγγλικά, του Natural Language Processing (Επεξεργασία Φυσικής Γλώσσας), γνωστού και ως NLP, για τον οποίο θα μιλήσουμε αναλυτικά στο τέλος.

Κατάτμηση της γλώσσας

Τι εννοούμε με την έννοια της κατάτμησης

Οι γλωσσολόγοι είχαν ήδη από πολύ νωρίς αντιληφθεί την περιγραφή της γλώσσας σαν μία διαδικασία κατάτμησης. Ένα κοίταγμα από το μικρότερο στο μεγαλύτερο, από το ειδικό στο γενικό. Για να γίνει πιο σαφές, μία απλή κατάτμηση είναι ο τρόπος που επικρατεί μέχρι σήμερα στο πως μαθαίνουμε γλώσσες, από την μητρική μας μέχρι τις παθητικές ξένες, όταν περνάμε την πόρτα του σχολείου. Η αντίληψη αυτή λέει πως μέσα από την κατανόηση (και την ορθότητα) των μικρότερων μονάδων που αποτελούν ένα σύνολο, μία πρόταση ένα κείμενο κλπ, μπορεί κανείς να συνθέσει ήδη από την πρώτη παιδική ηλικία ένα όλον, που να βγάζει νόημα και να μην είναι λάθος, γραμματικά ή συντακτικά.

Για να το καταφέρουν αυτό οι γλωσσολόγοι, και αργότερα να περάσει και στη σχολική παιδεία, εντοπίσανε και ορίσανε με φαινομενικά λογικές διαδικασίες τέτοια μικρότερα κομμάτια, τους φθόγγους και τα φωνήεντα, τις συλλαβές και τη στίξη, που κάποια συναντάμε αυτούσια στην γραμματική και τη σύνταξη. Μέσα στην ανάλυση τους ωστόσο, είχανε ήδη ξεκινήσει την κατάτμηση πολύ πριν φτάσουν σε ένα φωνήεν α, με συγκεκριμένες ιδιότητες και χρήση, ανακαλύπτοντας ένα τεράστιο εύρος διακρίσεων και διαφορών τμημάτων της γλώσσας. Οι διαχωρισμοί αυτοί τους χρησίμευαν  στην πιο αναλυτική μελέτη της γλώσσας από μέσα προς τα έξω και δεν τους συναντά κανένας από εμάς, σε κανένα σημείο της σχολικής του ζωής, και της ζωής του γενικότερα, εκτός αν επιλέξει να ασχοληθεί με το αντικείμενο. Πχ Οι γλωσσολόγοι είχαν χωρίσει το επικοινωνιακό σύστημα γλώσσα σε γλώσσα, λόγο και ομιλία, βγάζοντας ένα εύρος θεωρίες για αυτήν τους την κατάτμηση, είχανε διακρίνει τη γλώσσα σε μορφή και ουσία κλπ. Αργότερα χωρίσανε σε μέρη του λόγου, υποκείμενα, ρήματα αντικείμενα και μελετήσανε αντίστοιχα τις ιδιότητες τους. Με αυτό τον τρόπο καταφέρανε να αποκαλύψουν τους μηχανισμούς βάσει των οποίων λειτουργεί και σχηματίζεται πχ μία πρόταση.

Ο βασικότερος ωστόσο διαχωρισμός, πάνω στον οποίο και βασίστηκαν και έγιναν επιτρεπτά όλα τα παραπάνω ανήκει στον Ferdinand de Saussure. Αν και πλέον αυτονόητος στη γλωσσολογία, ο διαχωρισμός του Saussure είναι, όπως τα μεγαλύτερα των θεωρητικών ευρημάτων, καλά κρυμμένος από την σχολική καθημερινότητα μέχρι την υπολογιστική χρήση της γλώσσας. Πρόκειται για τον διαχωρισμό σημαίνον – σημαινόμενο.

Γλώσσα Σύστημα – Διαχωρισμός Σημαίνον Σημαινόμενο

Γλώσσα Σύστημα

Ή πώς για πρώτη φορά η γλώσσα αποκολλάται από τον ομιλητή

Ο Ferdinand de Saussure παρουσιάζει ως κύκλο μαθημάτων στη Γενεύη, τα έτη 1906-1907, 1908-1909, 1910-11, τα Μαθήματα Γενικής Γλωσσολογίας. Σε αυτά τα μαθήματα διατυπώνει τις βασικές του θεωρίες για πρώτη φορά ολοκληρωμένες σε μια προσπάθεια να χτίσει μία γενική θεωρία για τη γλώσσα. Τα μαθήματα αυτά διασώθηκαν μέσω των σημειώσεων των φοιτητών του.

Ο Saussure περιγράφει για πρώτη φορά σε αυτά τα μαθήματα τη γλώσσα ως σύστημα, δηλαδή σαν ένα οργανωμένο σύνολο σχέσεων. Αυτό όχι μόνο θα του επιτρέψει να προχωρήσει παρακάτω, αλλά θα σπρώξει μαζί του ολόκληρη τη γλωσσολογία μέχρι σήμερα και θα θέσει τον πυρήνα του στρουκτουραλισμού του 20ου αιώνα.

Τι σημασία έχει για αυτήν την εισήγηση αυτή η αντίληψη;

«Μία γλώσσα αποτελεί ένα σύστημα […] Το σύστημα αυτό είναι ένας περίπλοκος μηχανισμός. Δεν μπορεί κανείς να την δαμάσει παρά μόνο με τη σκέψη. Κι αυτοί οι ίδιοι που κάνουν χρήση αυτού του μηχανισμού, τον αγνοούν βαθύτατα. […]»

Σύμφωνα με τον Saussure η γλώσσα είναι ένα σύστημα, δηλαδή ένα οργανωμένο πλέγμα σχέσεων στοιχείων αναμεταξύ τους. Για να μπορέσει κανείς να την αναλύσει πρέπει να σταθεί στις σχέσεις των στοιχείων μεταξύ τους και να τα ορίσει ανάλογα με αυτές τις σχέσεις. Τα στοιχεία αυτά δεν μπορούν να ειδωθούν και να κατανοηθούν ξεχωριστά. Αυτά συνοπτικά για το πώς εννοούσε το σύστημα. Βάσει αυτής του της θέσης ο Saussure ξεκινά να επιδίδεται σε ένα εύρος διαχωρισμών και κατατμήσεων, να βάζει δηλαδή σε τάξη και να ορίζει τα στοιχεία αυτά και τις σχέσεις μεταξύ τους.

Δεν θα σταθούμε στο πως περιέγραψε ο Saussure αυτό το σύστημα, πρώτον γιατί θα άνοιγε ζητήματα καθαρά του αντικειμένου της γλωσσολογίας και δεύτερον γιατί δεν είναι αυτό που αφορά την εισήγηση, όσο το δεύτερο σημείο που ακολουθεί τη θέση αυτή: Η γλώσσα είναι σύστημα – που αγνοείται από τον ομιλητή της. Ο ομιλητής μπορεί να χρησιμοποιεί τη γλώσσα, αγνοεί ωστόσο το περίπλοκο σύστημα που κρύβεται πίσω από αυτήν του τη χρήση, τη λειτουργία του. Το πρώτο και άμεσο αποτέλεσμα αυτής της σκέψης του Saussure είναι η απομάκρυνση του υποκειμένου, (για τον γλωσσολόγο πρόκειται για το άτομο – ομιλητή, που μονολογεί τη γλώσσα του) άλλα και για ολόκληρα κοινωνικά σώματα που μοιράζονται το λόγο, από την γνώση της γλώσσας του/τους. Το δεύτερο αποτέλεσμα κοιτάει προς τον νέο ειδικό – αυθεντία που δημιουργείται. Ο γλωσσολόγος, ο καθ’ ύλην αρμόδιος επιστήμονας επί της γλώσσας, αναλαμβάνει διπλό ρόλο. Ένα να περιγράψει αυτό το σύστημα και δύο να μπορέσει να το διδάξει στον αδαή ομιλητή1. Για πρώτη φορά η γλώσσα νοείται σαν κάτι που ξεπερνά το υποκείμενο που την μιλάει, και χωράει επιστημονικής διερεύνησης, τοποθετείται έτσι στο μικροσκόπιο της επιστήμης. Η ανατομία, και σε δεύτερο χρόνο οι χειρουργικές τομές στα όργανα της γλώσσας και τις χρήσεις τους, πατάει πρώτα πάνω στην αντίληψη του συστήματος.

Για εμάς είναι προφανές πως οι ομιλητές, από την παιδική ηλικία μέχρι το τραγούδι την ποίηση τον διάλογο, έχουν πλήρη την επίγνωση της γλώσσας τους, όχι σαν ένα σύστημα που επιλέγουν κάθε φορά να συνθέσουν και να χρησιμοποιήσουν, αλλά μέσα από το κοινωνικό βίωμα της χρήσης της γλώσσας. Όπως δηλαδή είχαν και του σώματος τους, των ασθενειών και των χαρών του, χωρίς να γνωρίζουν τις βασικές θέσεις της ιατρικής για αυτό, το πώς πχ συνδέεται το μυαλό με το στομάχι. Την επίγνωση αυτή τη χάσανε (και την εγκαταλείψανε) αφού οι διάφορες επιστήμες μονοπώλησαν την αλήθεια της.

Με την απομάκρυνση του υποκειμένου από τη γνώση της γλώσσας συντελείται η πρώτη κλοπή εις βάρος τόσο του ίδιου όσο και της γλώσσας του. Η γλώσσα κλέβεται από τον ομιλητή, την μιλάει «τυχαία» (αυτή η τυχαιότητα έχει ήδη πάρει τις βάσεις της από την ψυχολογία και δεν αναφέρεται φυσικά ως τέτοια), αν όχι «αυτόματα». Ο κοινωνικός πλούτος που συνοδεύει την ομιλία μπαίνει στην άκρη σαν δευτερεύουσας σημασίας, οι ιστορικοί κοινωνικοί λόγοι αποκρύβονται, μπορούν και να μην ενδιαφέρουν.

Μικρή Παρένθεση

«Πριν τη γλωσσοποίηση δεν υπάρχουν προπαρασκευασμένες ιδέες. Πριν τη γλωσσοποίηση στο μυαλό είναι όλα σαν ένα νέφος και τίποτα δεν είναι υποστασιοποιημένο.»

Ένα δεύτερο υπό-σημείο, στο οποίο όμως δεν θα σταθούμε αλλά το αναφέρουμε ως τροφή για σκέψη, είναι ένα βήμα παραπάνω στην θεωρία του Saussure και αυτό που νομιμοποιεί το βάρος της θέσης του για το σύστημα. Ο Saussure έχει ανεβάσει τη γλώσσα σε ένα βάθρο και αυτή κοιτάζει τις σκέψεις και τις ιδέες από ψηλά. Όχι απλά αγνοεί κανείς την γλώσσα που μιλάει, αλλά πριν αντιληφθεί το λόγο σαν τρόπο να εκφράζεται δεν έχει καθαρές ιδέες. Πριν το λόγο, λέει ο Saussure, στα κεφάλια μας επικρατεί αταξία.

Σημαίνον και σημαινόμενο

Ή πως για πρώτη φορά η γλώσσα αποκολλάται από τη σημασία της

Ο Saussure παρουσιάζει σε αυτά τα μαθήματα για πρώτη φορά το γλωσσικό σημείο. Γλωσσικό σημείο είναι η λέξη σαν ακουστική εικόνα, η εκφορά της στον προφορικό λόγο και η σημασία της. Αυτό το παρουσιάζει ως έναν συνδυασμό δύο ψυχολογικών στοιχείων. Μίας έννοιας – αυτό που ονομάζει σημαινόμενο και μίας ακουστικής εικόνας – που ονομάζει σημαίνον.

Ο συνδυασμός αυτός, λέει ο Saussure, είναι αυθαίρετος. Δεν υπάρχει τίποτα που να συνδέει φυσικά ή λογικά αναγκαία αυτά τα δύο. Δεν υπάρχει καμμία σχέση ανάμεσα στην έννοια του βιβλίου με το πώς παρουσιάζονται οι ήχοι /vivlio/ για να δικαιολογεί την σύνδεση των δύο στο γλωσσικό σημείο βιβλίο. Το ίδιο εκτύπωμα (έτσι το ονομάζουνε) του ήχου /vivlio/ θα μπορούσε εξίσου να αντιστοιχεί στην έννοια τραπέζι. Αντίστοιχα το /trapezi/ θα μπορούσε να αντιστοιχεί στο βιβλίο και πάει λέγοντας.

Σε αυτό το σημείο ο Saussure κάνει ένα βασικό σχόλιο. Μπορεί το σημαίνον (η ακουστική εικόνα) να επιλέγεται ελεύθερα και να μην επιβάλλεται από καμμία φυσική ή λογική αναγκαιότητα είναι όμως δεδομένο για την γλωσσική κοινότητα, αποτελεί δηλαδή την κεντρική σύμβαση της γλώσσας2.

Για πρώτη φορά η λέξη αποκολλάται από την σημασία της, και μπορεί κανείς να την κοιτάξει κανείς έξω από αυτήν, επιβάλλεται, λέει ο Saussure, να την κοιτάξει κανείς έτσι, καθώς αυτή είναι αυθαίρετη. Έτσι συντελείται η πρώτη βασική τομή πάνω στο σώμα της γλώσσας. Η τομή είναι βαθιά και πλήρως διαχωριστική. Την γλώσσα θα την μελετήσουμε σαν σύστημα και γυμνή από τις σημασίες.

Universal Grammar_Το όνειρο του γλωσσολόγου και μια ατυχής εκπλήρωση

Η έννοια της καθολικής γραμματικής

«Με τον όρο καθολική γραμματική (universal grammar) γίνεται ακριβώς λόγος για τον απώτερο στόχο της γλωσσολογίας: να προσδιορίσει την πιθανή μορφή ενός γενικευμένου προτύπου γραμματικής, που να προσφέρεται για την ανάλυση της δομής οποιασδήποτε ‘ανθρώπινης γλώσσας’ – ανάμεσα σε όσες υπάρχουν από την μία μέχρι την άλλη άκρη του πλανήτη μας, αλλά και σε όσες θα μπορούσαν, με την ιδιότητα της ‘ανθρώπινης γλώσσας’, να έχουν επίσης υπάρξει ή να υπάρξουν.»

Ο Saussure περιέγραφε μόνο μία πτυχή αυτού του ονείρου. Το κομμάτι πριν το όνειρο. Αφού η γλώσσα είναι σύστημα, αφού οι κατά τόπους και χρόνους σημασίες μπορούν να μπουν στην άκρη, μένει ο επιστήμονας να φτιάξει ένα σύστημα που να μπορεί να φιλτράρει και να χωρέσει όλες τις δομές της ανθρώπινης γλώσσας. Αυτό το όνειρο του γλωσσολόγου θα ονομαστεί Καθολική Γραμματική. Και προς έκπληξη των θεωρητικών θα μπορέσει πρώτη φορά να πάρει μορφή ως τέκνο των θετικών επιστημών και να γίνει εφικτό μόνο όταν εφαρμοστεί στις νέες μηχανές.

«[…] Μία γραμματική της γλώσσας Γ είναι στην ουσία μία θεωρία της Γ […]»

Όταν ο Noam Chomsky παίρνει την σκυτάλη της γλωσσολογίας από τον Saussure, έξι δεκαετίες αργότερα, συντελείται η πιο χρήσιμη τομή για τους υπολογιστικούς γλωσσολόγους. Φτιάχνεται ό,τι πιο κοντινό υπάρχει μέχρι σήμερα στην καθολική γραμματική που φαντασιώνονταν οι γλωσσολόγοι, ξεπερνώντας την θεωρία και μιλώντας πλέον μαθηματικά. Ο Chomsky φτιάχνει την πρώτη ολοκληρωμένη αναπαράσταση ενός συστήματος φυσικής γλώσσας, όπως αργότερα θα το ονομάσουν οι υπολογιστικοί γλωσσολόγοι. Αυτό το κάνει στο βιβλίο του Συντακτικές Δομές, μόλις το 1957.

Αφήνοντας τη θεωρητική προσέγγιση της γλώσσας…

Δεν αρκούσε η θεωρία του Saussure για το σημαίνον και το σημαινόμενο για να αποβάλλουν οι μετέπειτα γλωσσολόγοι το άγχος της σημασίας, του νοήματος. Ξεκινώντας από το τέλος του βιβλίου του, η σημασιολογική προσέγγιση της γλώσσας στη δόμηση μίας τέτοιας καθολικής γραμματικής ήταν κάτι με το οποίο ο Chomsky ήρθε αντιμέτωπος και χρειάστηκε να απαντήσει καθαρά στο βιβλίο του. Το κατά πόσο δηλαδή είναι εφικτό να φτιάξει κανείς ένα σύστημα που να χωρά το μεγαλύτερο κομμάτι της γραμματικής της γλώσσας λαμβάνοντας υπόψη του τη σημασία, τα νοήματα των λέξεων, των προτάσεων κλπ. Ο Chomsky θεωρεί κάτι τέτοιο ανέφικτο. Παραδέχεται λοιπόν πως η γραμματική του είναι εντελώς τυπική και μη σημασιολογική και πως η χρήση της είναι καθαρά εργαλειακή. Για όσους δεν έχουν διαβάσει το βιβλίο λοιπόν, να πως ένας γλωσσολόγος κάνει τη γλώσσα εξίσωση.

 …για μία μαθηματική

Οι Συντακτικές Δομές δεν είναι ένα θεωρητικό, τυπικό γλωσσολογικό κείμενο. Παρουσιάζει όπως και πολλά πριν από αυτό, το βήμα προς βήμα στήσιμο μιας γραμματικής, της Γενετικής Μετασχηματιστικής όπως την ονομάζει ο Chomsky, μίας συντακτικής δομής για την αγγλική. Αυτό το κάνει με όρους μαθηματικών, βάζοντας σταθερές και δεδομένα.

Στο δεύτερο κεφάλαιο του βιβλίου του, ο Chomsky παίρνει ως δεδομένο πως η συντακτική του δομή θα αποτελείται από ένα πεπερασμένο σύνολο μονάδων. Παραθέτουμε από το δεύτερο κεφάλαιο με τίτλο Ανεξαρτησία της Γραμματικής, για να μπορέσετε να φανταστείτε την μαθηματική γραφή του στην αρχή της:

«Από εδώ και στο εξής, θα θεωρήσω ότι μία γλώσσα είναι ένα σύνολο (πεπερασμένο ή άπειρο) προτάσεων κάθε μία από τις οποίες έχει πεπερασμένο μήκος και κατασκευάζεται από ένα πεπερασμένο σύνολο μονάδων […] Παρόμοια, το σύνολο των «προτάσεων» κάποιου τυποποιημένου μαθηματικού συστήματος μπορεί να θεωρηθεί ως γλώσσα.»

Πριν ξεκινήσει να στήνει την γραμματική του ο Chomsky εξηγεί πως φτιάχνει έναν μηχανισμό, ο οποίος έχει πολύ σαφείς προδιαγραφές και στόχους. Αφού εξηγήσει το γιατί και το πώς του μηχανισμού αυτού ο Chomsky ξεκινά να φτιάχνει εξισώσεις, πρώτη εκ των οποίων είναι η γνωστή σε όλους μας (από το σχολείο):

Πρόταση = Ονοματική Φράση + Ρηματική Φράση

Με την αντίστοιχη μαθηματική αναπαράσταση

Π = ΟΦ + ΡΦ

Όπου ΟΦ = Ονοματική Φράση, ΡΦ = Ρηματική Φράση και Π = Πρόταση

Κατ’ αυτόν τον τρόπο συνεχίζει όλο το βιβλίο. Ο Chomsky ξεκινώντας από συμβολισμούς, φτιάχνει εξισώσεις με τις οποίες φιλτράρει προτάσεις για να αποδείξει την ορθότητα τους. Αφού τελειώσει με αυτό το κομμάτι, αρχίζει και εξετάζει μία λύση για τις διάφορες μη συμβατές σε αυτήν την μαθηματική αναπαράσταση προτάσεις.

Για να χωρέσει τις ασύμβατες στην βασική συντακτική δομή του προτάσεις ο Chomsky εισάγει την τομή του βιβλίου του, από την οποία και ονομάζει την Γραμματική του, τους μετασχηματισμούς. Οι μετασχηματισμοί εισάγονται στις βασικές εξισώσεις και αλλάζουν την πρόταση, πχ κάνουν την ενεργητική πρόταση το αντίστοιχο της παθητικής της. Μέχρι και το τέλος του βιβλίου του, ο μαθηματικός – γλωσσολόγος θα έχει ξετυλίξει μία μαθηματική θεωρία που θα παρουσιάσει ως Γραμματική. Ο Chomsky ξεπερνά τη γλώσσα σύστημα του Saussure, και προχωρά σε ένα σύστημα επεξεργασίας της γλώσσας. Αλλιώς, λέμε εμείς, ο Chomsky αναπαριστά πρώτη φορά νοερά, χωρίς τα τεχνικά και μεταλλικά της μέρη, μία μηχανή επεξεργασίας της ανθρώπινης (φυσικής όπως λένε) γλώσσας.

 Γλώσσα Μηχανή

Μία αναπαράσταση της γλώσσας

Στις Συντακτικές του Δομές, στο 6ο κεφάλαιο, με τίτλο, Στόχοι της Γλωσσολογικής Θεωρίας, ο Chomsky παριστάνει την γραμματική του θεωρία να λειτουργεί ως εξής:

universal

Δεν θέλουμε καθόλου να σταθούμε στο τι ακριβώς κάνει η μηχανή που παρουσιάζει ο Chomsky. Θέλοντας να αναιρέσει τις θεωρίες που μπορούν να φτιάξουν αυτήν την καθολική γραμματική ο Chomsky παρουσιάζει τρείς εκδοχές για να καταλήξει στην δικιά του. Επιλέγει να το κάνει αυτό αναπαριστώντας τις θεωρίες αυτές σαν της τρεις εκδοχές μίας μηχανής. Η δική του εκδοχή είναι η παραπάνω.

Σημασία για μας έχει πως ο Chomsky «φαντάστηκε» αυτήν την μηχανή. Σημασία έχει πως ο Chomsky ξεπερνά την έννοια του συστήματος, ξεπερνά και την έννοια του μηχανισμού και με ένα φαινομενικό άλμα πρώτη φορά ρητά παρουσιάζει μία μηχανή, μέσω της οποίας θα είναι εφικτό να λειτουργήσει η συντακτική του δομή. Η μηχανή αυτή έχει ως είσοδο της δύο γραμματικές (ΓΡ1 – ΓΡ2) και ένα σώμα κειμένου. Ως έξοδο έχει την πρώτη και τη δεύτερη γραμματική, αφού αυτές έχουν επεξεργαστεί το κείμενο, το έχουν δηλαδή αναλύσει. Με απλά λόγια: Μπορείς να εισάγεις στην μηχανή ένα σώμα κειμένου και δύο γραμματικές που θα έχουν ως σκοπό να το ελέγξουν. Που είναι το υποκείμενο, το αντικείμενο, το ρήμα, αν είναι ενεργητική ή παθητική η φωνή κλπ. Βλέποντας τα αποτελέσματα που θα έχουν παράγει οι γραμματικές, ο γλωσσολόγος θα μπορέσει να αποφασίσει ανάλογα, ποια εκ των δύο είναι προτιμητέα. Η μηχανή που φαντάζεται ο Chomsky, έχει δηλαδή input και output. Αυτό το κομβικό σημείο για την γλωσσολογία τότε, είναι η πρώτη ολοκληρωμένη φαντασίωση ενός αλγορίθμου για τη γλώσσα, που θα γίνεται εφικτός μέσα από μία μηχανή.

Ο Τσόμσκι έχει φτιάξει, μάλλον όχι εν αγνοία του, το πρώτο ολοκληρωμένο σύστημα επεξεργασίας φυσικής γλώσσας, που αργότερα θα δώσει το όνομα του στο Natural Language Processing και θα γίνει τεχνολογικά εφαρμόσιμο μέσω αυτής.

Μία παρένθεση

«Η εργασία αυτή χρηματοδοτήθηκε κατά ένα μέρος της από τον στρατό (Signal Corps), την αεροπορία (Office of Scientific Research, Air Research and Development Command) και το ναυτικό (Office of Naval Research) των ΗΠΑ, και κατά ένα άλλο μέρος από το Εθνικό Ίδρυμα Επιστημών (National Science Foundation) και την εταιρία Eastman Kodak»

Με λίγα λόγια, όταν ένας γλωσσολόγος εκδίδει μία εργασία που θέτει το ζήτημα της γλώσσας με τόσο πρακτικό τρόπο, και τα λίγα που παραθέσαμε από το βιβλίο του Chomsky νομίζουμε ότι κάνουν εμφανές πως δεν πρόκειται για μία κατεξοχήν θεωρητική ανάλυση, δεν μπορεί παρά να έχει λόγους να φτάσει τόσο κοντά στην εφαρμογή – της – θεωρίας σε κάτι άλλο, πιο πρακτικό, πιο της τεχνολογίας, του στρατού παραδείγματος χάρη. Η γενναία χρηματοδότηση που εξασφάλισε ο Chomsky από δω κι από κει για το έργο του δεν πήγε σίγουρα χαμένη. Και πολύ καιρό πριν εξασφαλίσει στην Υπολογιστική Γλωσσολογία τη δυνατότητα να τα εφαρμόσει όλα αυτά στους προσωπικούς μας ηλεκτρονικούς υπολογιστές, είχε σίγουρα βοηθήσει σε κάτι που χρειαζόταν ο στρατός, η αεροπορία και το ναυτικό ταυτόχρονα. Τελικά, ήταν ένας γλωσσολόγος με όραμα και ένα μάτσο φράγκα από καραβανάδες που καταφέρανε να φτιάξουν την πρώτη ολοκληρωμένη απεικόνιση ενός αυτόματου συστήματος της γλώσσας.

Natural Language Processing

Υπολογιστική Γλωσσολογία

Και εδώ είναι το σημείο που οφείλουμε να εξηγήσουμε κάποια λίγα σχετικά με την υπολογιστική γλωσσολογία, για να γίνει μόλις λίγο πιο χειροπιαστή σαν κλάδος. Όπως είπαμε η περιγραφή, η τεχνολόγηση και η παραγωγή γλώσσας συνέβαιναν και συμβαίνουν παράλληλα. Η υπολογιστική γλωσσολογία δεν ξεκινά βγάζοντας τόμους θεωρίας για τη γλώσσα, ξεκινά κατευθείαν την προσπάθεια να φτιάξει γλώσσες μηχανής, αλγορίθμους για την κατανόηση και το φιλτράρισμα της γλώσσας, με σκοπό να εξυπηρετήσει σκοπούς της αγοράς (και του στρατού πρώτα και κύρια, βλ. Chomsky). Η υπολογιστική γλωσσολογία, δεν δούλεψε ποτέ της για φλύαρους ακαδημαϊσμούς και φιλοσοφικές αναλύσεις. Είχε πάντα δίπλα της την Εφαρμοσμένη Υπολογιστική Γλωσσολογία,  Practical Natural Language Processing, την ίδια την μηχανή, να την οριοθετεί. Πρόκειται για μία επιστήμη που ήταν ανά πάσα στιγμή εφαρμόσιμη ή μη, και ως τέτοια αληθής ή ψευδής. Συνεχείς δοκιμές και πειραματισμοί πάνω στους υπολογιστές ήταν που επαληθεύανε, ή όχι, όσα λεγόντουσαν για τη γλώσσα.

Η υπολογιστική γλωσσολογία, στην πιο εύκολη εικονοποίηση της, είναι ένας γλωσσολόγος μαζί με έναν προγραμματιστή, που τους ενώνει ο ίδιος σκοπός. Η αποτελεσματικότητα της μηχανής.

Όσα κατάφερε και όσα όχι η μηχανή

Η υπολογιστική γλωσσολογία σήμερα

Ο τομέας της υπολογιστικής γλωσσολογίας θεωρεί αυτή τη στιγμή άλυτα, σχεδόν λυμένα και εντελώς λυμένα τα παρακάτω προβλήματα. Τα παραθέτουμε ενδεικτικά:

Λυμένα

-Την αναγνώριση των spam

-Την αναγνώριση μερών του λόγου

-Το Name Entity Recognition, το αν δηλαδή μια πληροφορία είναι τόπος, πχ χώρα, χρόνος, πχ μήνας, άνθρωπος, οργανισμός, ζώο, αντικείμενο κλπ. Κάτι σαν το Όνομα Ζώο Φυτό με όρους κυρίως ταξινόμησης

Μερικώς λυμένα – Εν εξελίξει

-Την ανάλυση συναισθημάτων (την εξηγούμε παρακάτω)

-Την σύνταξη

-Την αμφισημία (mouse: ποντίκι ή ποντίκι υπολογιστή)

-Το parsing, αυτό που στα ελληνικά (λανθασμένα) μεταφράζουνε ως συντακτική ανάλυση

Άλυτα – Ιδιαίτερης δυσκολίας

-Την διαδικασία που προσπαθούν από νωρίς, την ερώτηση και την απάντηση.

-Την παράφραση

-Την σύνοψη, περίληψη

-Και τον διάλογο ανθρώπου μηχανής

Αν ρίξει κανείς μία γρήγορη ματιά στα παραπάνω χωρίς να αφήσει το μυαλό του να τρέξει άμεσα σε δυστοπίες και ρομπότ που κλαίνε από συγκίνηση, καταλαβαίνει πως οι άμεσες λύσεις ζητήθηκαν κυρίως για την αναγνώριση της πληροφορίας από τον υπολογιστή. Αυτό είχε σχέση με την ανάγκη να ταξινομηθεί, επομένως και να αναγνωριστεί ένας τεράστιος όγκος δεδομένων. Από τις μηχανές αναζήτησης μέχρι τα προσωπικά mail, ο υπολογιστής πρέπει να είναι σε θέση να κατατάξει και να οργανώσει τον τεράστιο διαδικτυακό όγκο πληροφορίας, και να τον αναγνωρίσει σωστά, βάσει των αναγκών του χρήστη – καταναλωτή. Προς αυτόν τον τομέα κινούνται και οι προσπάθειες αναγνώρισης συναισθήματος μέσω της γλώσσας, κοιτώντας την στιγμή αυτή στην αξιολόγηση προϊόντων που ο καταναλωτής έχει αξιολογήσει σε διάφορα site και φτιάχνοντας στατιστικές. Προς το παρόν ευτυχώς, όσον αφορά το input πιο περίπλοκων συναισθημάτων σε μορφή λόγου, όπως αυτό ξεδιπλώνεται στις σχέσεις που μεσολαβούν τα social media, αυτό έχει εν πολλοίς αφεθεί στους χρήστες.

Επίλογος

Η μηχανοποίηση της γλώσσας σκόνταφτε και σκοντάφτει ακόμα στην σημασία, το νόημα. Οι προγραμματιστές και οι υπολογιστικοί γλωσσολόγοι, οι ειδικοί των αφεντικών που έχουν επωμιστεί το έργο της ανάλυσης της γλώσσας στην computer compatible εκδοχή της, στέκονται απέναντι στη Βαβέλ και τη βοή των νοημάτων της. Οι γλώσσες πρέπει να περιοριστούν και να οργανωθούν, να τις καταπιούν και να τις ξεράσουν οι μηχανές σε κάτι καινούριο, μετρήσιμο και πεπερασμένο. Η μηχανοποίηση της γλώσσας δημιουργεί μια «γλώσσα» καινούρια, ζωντανή και νεκρή ταυτόχρονα, με την απόλυτα αλαζονική αξίωση αυτή να είναι καθολική και για κάθε χρήση. Αυτή η καθολική γλώσσα έχει, κατά την τεχνολογία της, φαινομενικό σκοπό να χωρέσει όλες τις σημασίες. Εμείς θα στηρίξουμε πως στην πραγματικότητα η μηχανοποίηση της γλώσσας θέλει να ξεμπερδεύει με το μεγαλύτερο κομμάτι τους. Αυτό δεν το καταφέρνει μόνο παγιώνοντας το φετίχ των νέων τεχνολογιών (στις γλωσσικές τους μορφές κειμένου και προφορικότητας) και την αξιοπιστία των επιστημονικών της ευρημάτων. Δεν το κάνει με τρόπο άκομψο και βίαιο. Δεν έχει την ελάχιστη μετριοφροσύνη πως μπορεί και να μην τα καταφέρει. Αντίθετα, επιβεβαιώνεται κάθε φορά, όσο δουλεύει για αυτήν η εθελοντική και καθολική χρήση της γλώσσας μέσα από τους υπολογιστές. Και περιμένει στωικά τα νέα τεχνολογικά παραδείγματα να πετύχουν όσο ακόμα εκείνη δεν έχει καταφέρει.

Το μοντέλο είναι κοινό, παντού στο νέο παράδειγμα. Όσα χάθηκαν δεν χάθηκαν μόνο επειδή επιβλήθηκαν και μονοπώλησαν την καθημερινότητα. Αφέθηκαν και αφήνονται να ξεχαστούν από τον χρήστη. Οι κλοπές και οι αφαιρέσεις για τις οποίες μιλάμε στο game over παγιώνονται πρώτα και πάντα σαν φθορές στη συλλογική μνήμη.

Ο ανειδίκευτος χρήστης της γλώσσας ξεκινά με την επιθυμία της μεσολάβησης της μηχανής. Η μετεξέλιξη αυτής της επιθυμίας σε ανάγκη δεν επιβάλλεται από κανένα σκοτεινό χέρι από τα πάνω. Έχει δουλευτεί από καιρό με το hype του εμπορεύματος στις κοινωνικές σχέσεις που το έχουν ήδη ενσωματώσει, με την εργασία στη μηχανή, με την υπόσχεση για ευκολία, ταχύτητα και μπόλικα gigabyte «μνήμης».

Αυτή η εκστρατεία, καθώς θα ερχόταν σε πέρας από ειδικούς, δημιουργούσε την σκοτεινή της μεριά. Δημιουργούσε [ακριβώς για να μπορούν οι ειδικοί – και μόνο – να έχουν γνώση του «μηχανισμού» (συστήματος) πρώτα σαν θεωρία και ύστερα σαν κατάσταση «εκείνους που παρότι χρήστες είναι ανήξεροι των μυστικών». Με άλλα λόγια δεν ήταν μόνο στην εργασία αλλά ευρύτερα στην κοινωνία που η εισαγωγή μιας τεχνικής (πραγματικότητας και ιδεολογίας) δημιουργούσε τους δικούς της ανειδίκευτους3.

Κατ’ αυτόν τον τρόπο, εμείς μιλάμε μόνο για κάποια από τα θεωρητικά θεμέλια, ήδη αρκετά χρόνια πίσω από τις εφαρμοσμένες νέες τεχνολογίες. Να κοιτάζει κανείς την πολύτιμη φαντασία των ακαδημαϊκών (και τις χρηματοδοτήσεις τους, στο παράδειγμα του Chomsky), είναι χρήσιμο στη γνώση αυτών που ήρθανε και θα ‘ρθουν στο μέλλον, όσον αφορά τα αυτόματα των κοινωνικών σχέσεων. Αυτά.

 

ΚΑΙ ΤΑ ΩΡΑΙΑ

Και τα ωραία που τράβηξες, και τα μαλλιά

που τραβάς:

ποιο χτένι

θα τα καλοχτενίσει πάλι, τα ωραία μαλλιά;

Ποιο χτένι

σε τίνος το χέρι;

Και οι πέτρες που σώριασες,

αυτές που σωριάζεις:

τις σκιές πού θα ρίξουν,

και πόσο μακριά;

Κι ο αέρας που από πάνω περνά,

κι ο αέρας:

θα αρπάξει μια πέτρα απ΄ αυτές,

να την αποδώσει σε σένα;

 

Paul Celan

Αστερίσκοι

1 Ο Saussure στεκόταν στον προφορικό λόγο επειδή είχε ήδη διατυπωθεί η θεωρία ότι προϋπάρχει του γραπτού.

2 Πάνω σε αυτήν ακριβώς την κεντρική σύμβαση είναι που χωλαίνει τελικά και η θεωρία του όταν εμφανίζεται η πολύτιμη μεταφορά. «Η μεταφορά μας επιτρέπει να αντιλαμβανόμαστε το αφηρημένο. Είναι ένας τρόπος επιστροφής στη χαμένη, προ-γλωσσική, αμεσότητα της επαφής με τα πράγματα – όταν ακόμη δεν μας είχε αποκόψει από αυτά, διαμεσολαβώντας, η συμβολική ανθρώπινη γλώσσα με το γενικευτικό όσο και αφαιρετικό της χαρακτήρα.», Τάσος Χριστίδης, 2001. Η μεταφορά δεν περιορίζεται σε παγιωμένα μοτίβα και φράσεις, παρά παράγεται διαρκώς από τους ομιλητές. Γεννιέται, μαζί με τους ποιητές και τα πολιτικά συνθήματα, πάνω στο σπάσιμο της κεντρικής σύμβασης της γλώσσας, κοινωνικής και πολιτικής.

3 Σημειώσεις πάνω σε έναν αιώνα, Zipo _ βιβλιοθήκη Sarajevo

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>