Ioanna Malagardi: ΕΠΕΞΕΡΓΑΣΙΑ ΛΟΓΟΥ ΣΕ ΣΥΣΤΗΜΑΤΑ ΜΗΧΑΝΙΚΗΣ ΜΕΤΑΦΡΑΣΗΣ

Πέμπτη 17 Φεβρουαρίου 2011

ΕΠΕΞΕΡΓΑΣΙΑ ΛΟΓΟΥ ΣΕ ΣΥΣΤΗΜΑΤΑ ΜΗΧΑΝΙΚΗΣ ΜΕΤΑΦΡΑΣΗΣ

Ιωάννα Δ. Μαλαγαρδή

1. Εισαγωγή

Η Επεξεργασία Λόγου με Υπολογιστή (Natural Language Processing) αφορά στη μελέτη και υλοποίηση υπολογιστικών συστημάτων για την επεξεργασία φυσικής γλώσσας με υπολογιστή με στόχο την ανάλυση και σύνθεση κειμένων φυσικής γλώσσας. Το γνωστικό πεδίο της δραστηριότητας αυτής υπάγεται στο ευρύτερο πεδίο της Τεχνητής Νοημοσύνης (ΤΝ) με την προϋπόθεση ότι χρησιμοποιούνται για την υλοποίηση των συστημάτων βάσεις γνώσεων. Οι βάσεις αυτές κωδικοποιούν γλωσσικές και εξωγλωσσικές γνώσεις και χρησιμοποιούνται για την εξαγωγή συμπερασμάτων με τους κατάλληλους μηχανισμούς συμπερασμού. Για τις εφαρμογές Επεξεργασίας Λόγου χρησιμοποιείται ο όρος Γλωσσική Τεχνολογία (ΓΤ). Οι εφαρμογές της ΓΤ στοχεύουν στην ανάλυση και σύνθεση κειμένων ανθρώπινης γλώσσας με υπολογιστή. Τα είδη του λόγου για τα οποία έχει γίνει προσπάθεια να αναλυθούν στο πλαίσιο των ανωτέρω εφαρμογών είναι ο ερωτηματικός λόγος, ο αφηγηματικός λόγος και ο μη-αφηγηματικός λόγος. Ο ανθρώπινος λόγος αποτελεί το μέσον ανάπτυξης ανθρωπίνων δραστηριοτήτων όπως είναι η ιστορία, η λογοτεχνία, η επιστήμη και η τεχνολογία που χρησιμοποιούν τα παραπάνω είδη του λόγου. Στις αρχές της δεκαετίας του ’50 εμφανίζονται οι πρώτες προσπάθειες επίλυσης προβλημάτων φυσικής γλώσσας με υπολογιστή. Κατά την περίοδο αυτή εμφανίζονται και τα πρώτα βιομηχανικά προϊόντα. Θα περιοριστούμε στις εφαρμογές που αναπτύχθηκαν από την βασική έρευνα σε βιομηχανική έρευνα. Οι κυριότεροι τομείς εφαρμογής της ΓΤ για τον γραπτό λόγο είναι:

 Η Μηχανική Μετάφραση
 Η Απάντηση Ερωτήσεων
 Η Κατανόηση Αφηγηματικών Κειμένων
 Η Εξαγωγή Πληροφορίας

Η ΜΜ είναι ο πρώτος κλάδος της ΓΤ που αναπτύχθηκε ενώ οι υπόλοιποι κλάδοι αναπτύχθηκαν αργότερα. Λόγω αυτών των γεγονότων οι ιστορικές επισκοπήσεις στην διεθνή βιβλιογραφία για τους άλλους κλάδους της ΓΤ εκτός της ΜΜ είναι σχεδόν ανύπαρκτες [11]A. Joscelyne, 2004]. Υπάρχουν πολύ σύντομες αναφορές σε παλαιότερους ερευνητές ως τμήματα τεχνικών εργασιών. Οι μόνες εκτεταμένες ανασκοπήσεις αφορούν τον κλάδο της ΜΜ. Ο πιο γνωστός ερευνητής ασχολούμενος με την ιστορία της ΜΜ είναι ο W. John Hutchins, ο οποίος έχει συγγράψει εργασίες και βιβλία για την εξέλιξη του κλάδου. Τα συστήματα Μηχανικής Μετάφρασης (ΜΜ) σχεδιάζονται έτσι ώστε να μιμούνται κατά το δυνατόν τη διανοητική λειτουργία του ανθρώπου- μεταφραστή. Οι μεταφραστές χρησιμοποιούν τουλάχιστον πέντε διαφορετικά είδη γνώσης:

 γνώση της γλώσσας πηγής
 γνώση της γλώσσας στόχου
 γνώση αντιστοιχιών μεταξύ γλώσσας πηγής και γλώσσας στόχου
 γνώση του αντικειμένου του θέματος που περιλαμβάνει και συνήθη γενική γνώση και κοινή λογική
 γνώση του πολιτισμού, των κοινωνικών συμβάσεων, των εθίμων κ.λπ. των ομιλητών των δύο γλωσσών.

Η επεξεργασία από υπολογιστή που απαιτείται για την κατανόηση και τη μετάφραση ενός κειμένου διακρίνεται σε δύο κυρίως είδη, την ανάλυση και τη σύνθεση. Η ανάλυση αφορά κυρίως το μερισμό (parsing) των προτάσεων και την παραγωγή μιας αναπαράστασης του περιεχομένου των προτάσεων επεξεργάσιμη από υπολογιστή. Η σύνθεση αφορά την παραγωγή ή γένεση προτάσεων με βάση την τυπική αναπαράσταση. Δηλαδή η σύνθεση είναι μία διαδικασία αντίστροφη από αυτή της ανάλυσης. Στην περίπτωση της μηχανικής μετάφρασης οι διαδικασίες αυτές πρέπει να εκτελούνται αυτομάτως από τον υπολογιστή. Η λειτουργία ενός μεριστή (parser) συνίσταται στην εφαρμογή μιας γραμματικής σε μία πρόταση για να επιτύχει τα εξής: α) Τον έλεγχο της γραμματικότητας της πρότασης και β) την επίδειξη του τρόπου συνδυασμού των λέξεων σε φράσεις και του συνδυασμού των φράσεων στις αποδεκτές προτάσεις. Η απόρριψη των μη αποδεκτών προτάσεων είναι απαραίτητη για την αποφυγή άσκοπης περαιτέρω εργασίας του υπολογιστή [1]. Στη συνέχεια θα αναφερθούμε σε ορισμένα βασικά συστήματα ΜΜ που στηρίζονται σε μεθοδολογίες που χρησιμοποιούν βάσεις γνώσης. Τα συστήματα αυτά εμπίπτουν στην κατηγορία MT Systems όπως αυτή ορίζεται από τον J. Hutchins (2003), ως εξής: «MT system: software for automatic translation, where input units are full sentences of one natural language and the output units are corresponding full sentences of another language». Τα συστήματα ΜΜ ομαδοποιούνται στην παρούσα εργασία σύμφωνα με την χώρα προέλευσής τους σε δύο κατηγορίες ως εξής: Σε αυτά που προέρχονται από χώρες εκτός ΕΕ και σε εκείνα που προέρχονται από χώρες εντός ΕΕ.

2. ΜΜ εκτός Eυρωπαϊκής Ένωσης

Τα πρώτα έργα ΜΜ χρηματοδοτήθηκαν από στρατιωτικούς και άλλους κυβερνητικούς φορείς των ΗΠΑ κατά την δεκαετία του 1950. Το όραμα της εποχής εκείνης ήταν η δημιουργία υπολογιστικών συστημάτων ΜΜ με υψηλή ταχύτητα και ποιότητα [16] [J. Slocum, 1985]. Ένα από τα πρώτα συστήματα ΜΜ που αναπτύχθηκαν και υλοποιήθηκαν είναι το GAT του Πανεπιστημίου Georgetown. Οι εργασίες του συστήματος άρχισαν το 1952. To 1954 έγινε η πρώτη στον κόσμο δημόσια επίδειξη του συστήματος ΜΜ από την ομάδα του GAT. Επιδείχτηκε η μετάφραση 49 προσεκτικά επιλεγμένων ρωσικών προτάσεων προς την Αγγλική χρησιμοποιώντας ένα πολύ περιορισμένο λεξιλόγιο 250 λέξεων και μόλις έξι κανόνες γραμματικής. Το επίτευγμα αυτό αν και είχε μικρή επιστημονική αξία ήταν αρκετά εντυπωσιακό ώστε να προκαλέσει την χρηματοδότηση της έρευνας στην ΜΜ στις ΗΠΑ και την έναρξη έργων σε άλλα μέρη του κόσμου ιδιαίτερα στην τότε ΕΣΣΔ. Το σύστημα δεν υποστηριζόταν ούτε από κάποια γλωσσολογική ούτε από κάποια υπολογιστική θεωρία [12], [16] [J. Slocum, 1985], [Jordan et al.1977]. Το σύστημα GAT υποστηρίχθηκε από την κυβέρνηση των ΗΠΑ και οι πρώτες επιδείξεις του ολοκληρωμένου GAT έγιναν το 1961 και το 1962. Το τελικό σύστημα τέθηκε σε λειτουργία το 1964 στην Αμερικανική Επιτροπή Ατομικής Ενεργείας και ειδικά στο Εθνικό Εργαστήριο του Oak Ridge (ORNL) και επίσης στο Ευρωπαϊκό Ερευνητικό Κέντρο της EURATOM στο Κέντρο της Ispra στην Ιταλία το 1963. Και οι δύο εγκαταστάσεις του συστήματος χρησιμοποιήθηκαν για πολλά χρόνια για να μεταφράζουν ρωσικά κείμενα σε απλά Αγγλικά. Η ποιότητα των μεταφράσεων ήταν αρκετά ανεπαρκής συγκρινόμενη με την ανθρώπινη μετάφραση. Στην EURATOM το σύστημα GAT χρησιμοποιήθηκε μέχρι το 1976 και στο ORNL τουλάχιστον μέχρι το 1979. Οι δυσκολίες του πρώτου συστήματος δημιούργησαν αρνητικές αντιδράσεις εκ μέρους των χορηγών. Οι αντιδράσεις κορυφώθηκαν με την παρουσίαση της έκθεσης ALPAC (Automatic Language Processing Advisory Committee) του 1966 της Εθνικής Ακαδημίας των Επιστημών των ΗΠΑ που καταδίκαζε το πεδίο και έμμεσα τους εργαζόμενους σε αυτό. Κατά το 1973 υπήρχαν μόνο τρία έργα ΜΜ χρηματοδοτούμενα από τις ΗΠΑ και κατά το 1975 δεν υπήρχε κανένα. Παραδόξως ορισμένα συστήματα ΜΜ εξακολουθούσαν να χρησιμοποιούνται από διάφορες κυβερνητικές υπηρεσίες απλώς διότι δεν υπήρχε άλλος τρόπος για την τόσο ταχεία συλλογή πληροφοριών από ξένες πηγές, κυρίως ρωσικές. Παραλλήλως υπήρχαν ιδιωτικές επιχειρήσεις που ανέπτυσσαν και εμπορεύονταν συστήματα ΜΜ βασισμένα στην τεχνολογία της δεκαετίας του ΄60 που τόσο είχε κατηγορηθεί από την έκθεση ALPAC. Το διεθνές ενδιαφέρον αναζωπυρώθηκε κατά την δεκαετία του ’80 και συστήματα άρχισαν να χρησιμοποιούνται ευρέως στην κυβέρνηση, στις επιχειρήσεις και στην βιομηχανία. Το 1984 περίπου 500.000 σελίδες κειμένου μεταφράστηκαν με υπολογιστή [16] [J. Slocum, 1985]. Ο Peter Toma, ένα μέλος της ομάδας του GAT, δημιούργησε μια εταιρεία που ανέπτυξε το σύστημα SYSTRAN, το οποίο το 1970 αντικατέστησε το σύστημα MARK II της IBM στο τμήμα ξένης τεχνολογίας της USAF. Σε αντίθεση με το GAT στηρίχθηκε σε μια σαφή γλωσσολογική θεωρία. Σύμφωνα με την θεωρία τους δημιουργείται μια δομή εξάρτησης (dependency structure) η οποία χρησιμοποιείτο για την σύνθεση του κειμένου στην γλώσσα εξόδου. Το 1976 το σύστημα SYSTRAN αντικατέστησε το GAT στην EURATOM. Το SYSTRAN ήταν ένα από τα πρώτα συστήματα που στόχευε στην αγορά. Η πρώτη εγκατάστασή του έγινε το 1970 στην USAF με στόχο την μετάφραση από Ρωσικά στα Αγγλικά. Στη συνέχεια το 1974 η NASA επέλεξε το SYSTRAN για την μετάφραση υλικού σχετικού με την συνεργασία του διαστημικού προγράμματος Apollo-Soyuz.
Η διαδικασία μετάφρασης ενός κειμένου από το SYSTRAN περιλαμβάνει τα εξής στάδια: Προεπεξεργασία, Ανάλυση, Μεταφορά και Σύνθεση. Στο στάδιο της προεπεξεργασίας εκτελούνται εργασίες ανίχνευσης λέξεων και φράσεων. Στο στάδιο της ανάλυσης εκτελούνται εργασίες χαρακτηρισμού των ομογράφων, αναγνώρισης προτάσεων και συντακτικών δομών. Ακολουθεί το στάδιο της διαδικασίας της μεταφοράς προς την γλώσσα στόχο και τέλος το στάδιο της διαδικασίας της σύνθεσης όπου παράγεται το μεταφρασμένο κείμενο στην γλώσσα-στόχο. Το έργο METAL που άρχισε το 1961 με υποστήριξη της κυβέρνησης των ΗΠΑ στο Πανεπιστήμιο του Τέξας για μετάφραση από την Γερμανική στην Αγγλική και ολοκληρώθηκε το 1974 αποτελούμενο από 80.000 γραμμές σε γλώσσα Fortran που έτρεχε σε ένα υπολογιστή CDC 6600. Τερματίστηκε λόγω διακοπής της χρηματοδότησης από την κυβέρνηση των ΗΠΑ. Στο σύστημα υιοθετήθηκε η Μετασχηματιστική Θεωρία του Ν. Chomsky. Γρήγορα διαπιστώθηκε ότι η θεωρία δεν ήταν αρκετά αναπτυγμένη ώστε να υποστηρίξει ένα λειτουργικό σύστημα και έτσι χρειάστηκε να γίνουν διάφοροι συμβιβασμοί. Μερικά χρόνια αργότερα το έργο αναβίωσε με μια μικρή κυβερνητική χορηγία. το πρόγραμμα ξαναγράφτηκε σε γλώσσα Lisp για να τρέχει σε υπολογιστή DEC-10. Παράλληλα το Sprachendienst Department της SIEMENS AG στο Μόναχο άρχισε να υποστηρίζει το έργο και το 1980 η SIEMENS AG παρέμεινε ο μοναδικός χορηγός του έργου. Το 1965 το Πανεπιστήμιο του Montreal ξεκίνησε το έργο TAUM με υποστήριξη της καναδικής κυβέρνησης που ήταν πιθανόν το πρώτο έργο ΜΜ που σχεδιάστηκε με βάση την μέθοδο του Transfer σε αντίθεση με την Interlingua και χρησιμοποιήθηκε για την υλοποίηση η γλώσσα Fortran αρχικά σε υπολογιστή CDC 6600 και αργότερα σε υπολογιστή CYBER 173. Το σύστημα παραδόθηκε το 1975 για την μετάφραση από τα Αγγλικά στα Γαλλικά για κείμενα πρόγνωσης καιρού το αποκαλούμενο TAUM-METEO το οποίο εγκαταστάθηκε το 1977 για παραγωγή στην Καναδική Μετεωρολογική Υπηρεσία. [16], [17] [J. Slocum, 1985, σελ. 5-6]. Τα κείμενα εισόδου στο TAUM-METEO περιελάμβαναν περί τις 24.000 λέξεις ημερησίως. Η μετάφραση των κειμένων αυτών είχε ποσοστό επιτυχίας από 90-95%. Το υπόλοιπο 5-10% που αποτύγχανε αποδόθηκε σε διάφορους παράγοντες όπως: σε τηλεπικοινωνιακό θόρυβο, σε ορθογραφικά λάθη, σε λέξεις που δεν περιλαμβάνονταν στο λεξικό και σε κάποια ανεπάρκεια του συστήματος ως προς τον χειρισμό ορισμένων γλωσσικών δομών. Οι υπολογιστικές απαιτήσεις για την λειτουργία του συστήματος ήταν 15΄ κεντρικής μονάδας επεξεργασίας (CPU Time) ανά ημέρα σε υπολογιστή CDC 7600. Το σύστημα χρησιμοποιήθηκε για την μετάφραση από Αγγλικά σε Γαλλικά εγχειριδίων αεροπλοΐας. Το 1977 η ομάδα ενσωμάτωσε στο σύστημα μια σημασιολογική ανάλυση μεγάλης έκτασης για την αντιμετώπιση προβλημάτων της συντακτικής ανάλυσης συνθέτων πολλαπλών ουσιαστικών που συναντώνται στην Αγγλική και ιδιαίτερα σε τεχνικά εγχειρίδια. Το ειδικό αυτό σύστημα ονομάστηκε TAUM-AVIATION και τερματίστηκε το 1981. [J. Slocum, 1985, σελ.8]. Το 1964 άρχισε η ανάπτυξη του συστήματος LOGOS του οποίου η πρώτη εγκατάσταση έγινε το 1971 χρησιμοποιήθηκε από την Αμερικανική Πολεμική Αεροπορία (USAF) για την μετάφραση εγχειριδίων συντήρησης στρατιωτικού εξοπλισμού από τα Αγγλικά στα Βιετναμέζικα. Λόγω της λήξης του πολέμου στο Βιετνάμ η χρήση από την USAF τερματίστηκε. Το 1978 η SIEMENS AG άρχισε να χρηματοδοτεί την ανάπτυξη ενός συστήματος ΜΜ από Γερμανικά στα Αγγλικά για εγχειρίδια τηλεπικοινωνιών με βάση το LOGOS. Ένα σύστημα παραγωγής παραδόθηκε μετά από τρία χρόνια αλλά θεωρήθηκε ακατάλληλο για πρακτική εφαρμογή από την SIEMENS AG. Τελικώς η ομάδα LOGOS έκλεισε μια συμφωνία που επέτρεπε την υλοποίηση ενός συστήματος ΜΜ από Γερμανικά προς Αγγλικά για τους υπολογιστές της εταιρείας WANG. Αυτό το σύστημα διατέθηκε εμπορικά και αγοράστηκε από διάφορες πολυεθνικές εταιρείες όπως η NIXDORF, TRIOUMPH-ADLER και HEWLETT-PACKARD.

3. Μηχανική Μετάφραση στην Ευρωπαϊκή Ένωση

Το έτος 1977 αναγνωρίστηκαν οι ανάγκες για ΜΜ στην ΕΕ για τους εξής λόγους:
1. Προοπτική διεύρυνσης της ΕΕ με νέα μέλη
2. Πολιτική απόφαση για ισότητα των γλωσσών
3. Τεράστιος φόρτος μεταφραστικού έργου
4. Υστέρηση της ΕΕ έναντι ΗΠΑ και Ιαπωνίας στην ΓΤ

Ως συνέπεια των παραπάνω το 1978 λήφθηκαν δύο αποφάσεις ιστορικής σημασίας: 1). Αγορά του συστήματος SYSTRAN για την αντιμετώπιση των άμεσων αναγκών μετάφρασης και την επέκτασή του με χρηματοδότηση της ΕΕ σε νέα ζεύγη γλωσσών και 2) Ανάπτυξη νέου συστήματος με δύο στόχους α) Απόκτηση ενός εξελιγμένου συστήματος για όλες τις γλώσσες των κρατών-μελών και β) Ανάπτυξη της ΓΤ γενικότερα στην ΕΕ.

Το 1976 η Ευρωπαϊκή Επιτροπή αγόρασε την έκδοση SYSTRAN από Αγγλικά προς Γαλλικά για αξιολόγηση και πιθανή χρήση. Το αγγλο-γαλλικό λεξικό που δόθηκε από τον P. Toma μαζί με το σύστημα στην Ευρωπαϊκή Επιτροπή θεωρήθηκε άχρηστο για το περιβάλλον και καταβλήθηκαν προσπάθειες βελτίωσης λόγω της επείγουσας ανάγκης. Το 1985 περίπου 20 μεταφραστές της Ευρωπαϊκής Επιτροπής χρησιμοποιούσαν στο Λουξεμβούργο το SYSTRAN σε έναν υπολογιστή SIEMENS 7740 για μετάφραση ρουτίνας. Η επιτυχία αυτή οφείλεται στο ότι είχαν ήδη δημιουργηθεί λεξικά με 100.000 λήμματα και αφορούσαν τις τεχνολογικές περιοχές που εφαρμοζόταν το σύστημα. Στη συνέχεια εφαρμόστηκε το SYSTRAN και σε άλλα ζεύγη γλωσσών μεταξύ των οποίων και ζεύγη που περιέχουν και τα Ελληνικά. Η απόφαση για την δημιουργία του συστήματος EUROTRA λήφθηκε από την τότε ΕΟΚ το έτος 1982 [7], [8] [C. Copeland et al., 1991, σελ.. 7-14]. Κατά συνέπεια η τεχνολογία στην οποία βασίστηκε η σχεδίαση του συστήματος είναι της εποχής εκείνης και γιαυτό δεν αντιμετωπίζεται η αξιοποίηση βάσεων γνώσεων πέραν των γλωσσικών [7], [8] [C. Copeland et al. 1991, σελ. 7-14]. Οι νεώτερες απόψεις για την ΜΜ που αναγνώριζαν την ανάγκη αξιοποίησης γνώσεων πέραν των γλωσσικών, όπως της γνώσης του κόσμου, για την επίλυση πολυσημιών [14], [15] [Ι. Malagardi, 1996]. Μετά την λήξη του ερευνητικού προγράμματος EUROTRA τα αποτελέσματά του δεν χρησιμοποιήθηκαν για την ανάπτυξη εμπορικού προϊόντος. Ως εμπορικό προϊόν στην Ευρώπη αυτήν την στιγμή επικρατέστερο θεωρείται το SYSTRAN το οποίο κυκλοφορεί ως εμπορικό προϊόν για την αμφίδρομη μετάφραση του ζευγών της Ελληνικής με άλλες Ευρωπαϊκές γλώσσες. Σημειώνεται ότι στην παρούσα φάση το εξαγόμενο κείμενο απαιτεί διορθωτική μετεπεξεργασία από άνθρωπο, ώστε να είναι κατάλληλο για χρήση (Fourla A., et al., 2000). Ένα σύγχρονο έργο με σχετική τεχνολογία είναι το πρόγραμμα VERBMOBIL το οποίο αφορά σε προφορική επικοινωνία μέσω ενός συστήματος μετάφρασης που ξεκίνησε με υποστήριξη της Γερμανικής κυβέρνησης το 1993 [18].

4. Επίλογος

Η εξέλιξη της ΜΜ που αφορά στην περίοδο από την δεκαετία του ’50 μέχρι σήμερα ειδικά για τον γραπτό λόγο. Κατά την αρχή της ιστορικής αυτής περιόδου εμφανίζονται οι πρώτες προσπάθειες μετάφρασης φυσικής γλώσσας με υπολογιστή. Κατά την περίοδο αυτή εμφανίζονται και τα πρώτα βιομηχανικά προϊόντα. Όσον αφορά στην εξέλιξη της τεχνολογίας της ΜΜ στην ΕΕ υποστηρίζεται εδώ η υπόθεση ότι η επένδυση των πόρων θα ήταν πιο αποδοτική εάν είχαν διερευνηθεί και άλλες μέθοδοι πέραν εκείνων που οδήγησαν στο πολυεπίπεδο σύστημα μετάφρασης EUROTRA. Ως κυριότερη αιτία της μειωμένης αποδοτικότητας θεωρούμε την απορρόφηση των πόρων από δραστηριότητες που στηριζόνταν δογματικά στο πολυεπίπεδο σύστημα μετάφρασης. Κατά την γνώμη μας η επένδυση θα μπορούσε να αποδώσει περισσότερο εάν είχε ενισχυθεί αφενός το έργο ανάπτυξης του SYSTRAN και αφετέρου η ανάπτυξη συστήματος με όσο το δυνατόν λιγότερα επίπεδα και βασισμένο σε συστήματα Τεχνητής Νοημοσύνης (ΤΝ). Λεπτομερείς πληροφορίες για σημερινά εμπορικά προιόντα ΜΜ καθώς και για υπολογιστικά εργαλεία υποστήριξης υπάρχουν στην μελέτη του J. Hutchins “Compendium of Translation Software”, η οποία ανανεώνεται και συμπληρώνεται ετησίως. Μια νεότερη τελείως ριζοσπαστική εξέλιξη είναι εκείνη η οποία αγνοεί πλήρως τις υπάρχουσες θεωρίες και επιχειρεί την ανακάλυψη νέων θεωριών σε μορφή κανόνων που προκύπτουν με την εφαρμογή μεθόδων μηχανικής μάθησης και μηχανικής ανακάλυψης σε κείμενα επισημειωμένα από ανθρώπους. Η περαιτέρω εξέλιξη των μεθόδων αυτών στοχεύει στην πλήρη αυτοματοποίηση της διαδικασίας δημιουργίας γλωσσολογικών θεωριών από πειραματικά δεδομένα.

ΒΙΒΛΙΟΓΡΑΦΙΑ

[1] Arnold, D. et al (1994). Machine Translation. An Introduction Guide. NCC Blackwell. Manchester, Oxford.
[2] Chomsky, N. (1972). Studies in Semantics in Generative Grammar. The Hague: Mouton.
[3] The EUROTRA Linguistic Specifications (1991). Studies in Machine Translation and Natural Language Processing. Edided by C. Copeland, J. Durand, S. Krauwer, B. Maegaard. Commission of the European Communities. Vol. 1.
[4] The EUROTRA formal Specifications (1991). Studies in Machine Translation and Natural Language Processing. Edided by C. Copeland, J. Durand, S. Krauwer, B. Maegaard. Commission of the European Communities. Vol. 2.
[5] Fourla A., et al. (2000). The contribution of a user group to the evaluation and improvement of an MT system. Translating and the Computer 22
[6] Hutchins, W. J. (1995). Machine Translation: A Brief History. Concise history of language Sciences: from the Sumerians to the cognitivists. Edited by E.F.K. Koerner and R.E. Asher. Oxford: Pergamon Press. Pp. 431-445.
[7] Hutchins, W. J. (2003). Compendium of Translation Software. Sixth Edition. European Association for Machine Translation. http://www.eamt.org/.
[8] Joscelyne, A.(2004). History anyone?. Blogos, May 2004.
[9] Jordan, S., R., et al. (1976). Computerized Russian Translation at ORNI. Proceedings of the ASIS Annual Meeting. San Franzisco: 163. Also 1977 in ASIS Journal 28(1): 26-33.
[10] Μαλαγαρδή Ι., (1995a). Συγκριτική Ανάλυση να και για να δομών της Ν. Ελληνικής με αντίστοιχες δομές της Γερμανικής και Εφαρμογή στη ΜΜ. ΕΚΠΑ. Αδημ. Διδ. Διατριβή.
[11] Malagardi, Ι. (1995b). “Τhe resolution of the subject ambiguity in sentences with "ya na” using domain knowledge and related problems in their machine translation" Proceedings of the 2nd International Conference on Greek Linguistics. Salzburg University pp. 369-378.
[12] Slocum, J. (1985). A Survey of machine Translation: On History, Current Status and Future Prospects. Computational Linguistics.Vol. 11. No 1. pp. 1-17.
[13] Thouin, B. (1982). The METEO System. In Lawson 1982. pp. 39-44.
[14] Verbmobil (Multilingual Processing of Spontaneous Speech). http://verbmobil.dfki.de.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

Εγγραφή σε: Σχόλια ανάρτησης (Atom)

Ioanna's Blog

Στο ιστολόγιο μου θα αναρτώνται κείμενα επιστημονικού και γενικού ενδιαφέροντος. Ελπίζω σε μελλοντικές εποικοδομητικές συζητήσεις και προτάσεις.

Κείμενα που αναρτώνται στο ιστολόγιο εκφράζουν προσωπικές απόψεις των συγγραφέων τους.

My blog will present texts of scientific and general interest. I am looking forward to constructive discussions and proposals.

Articles published οn the blog expresses personal opinions of their authors.

Email: imalagardi2005@yahoo.gr

Ποίημα Ιωάννη Κόντου

ΡΥΠΑΝΣΗ

Βάλε χέρια, βγάλε χέρια,
λαμποκοπούν τ’αστέρια.
Βάλε πόδια, βγάλε πόδια,
παραμονεύουν τα χταπόδια.
Όμως νεκρά τα ψάρια
στης ρύπανσης τα χνάρια.
Ευτροφισμός και πίσσα
στυγνού παντρόνου λύσσα.
Γεμίσαν μαύρα λύματα
τα γαλανά μας κύματα.
Δεν ιριδίζουν κρυσταλλένια
και μοιάζουν ατσαλένια.
Σε σκάφανδρα μονάχα
Θα ζήσω τώρα τάχα.

Ioanna Malagardi

Πέμπτη 17 Φεβρουαρίου 2011

ΕΠΕΞΕΡΓΑΣΙΑ ΛΟΓΟΥ ΣΕ ΣΥΣΤΗΜΑΤΑ ΜΗΧΑΝΙΚΗΣ ΜΕΤΑΦΡΑΣΗΣ

Δεν υπάρχουν σχόλια:

Φεστιβάλ Ικαρίας

Old Greek Industry

Σελίδες

Daedalos Ikaros