Παρασκευή 26 Απριλίου 2024
weather-icon 21o
Τεχνολογία της Μicrosoft προσφέρει διερμηνεία σε πραγματικό χρόνο

Τεχνολογία της Μicrosoft προσφέρει διερμηνεία σε πραγματικό χρόνο

Ένα πειραματικό σύστημα που μεταφράζει τα λόγια ενός αγγλόφωνου ομιλητή στα κινέζικα, σχεδόν σε πραγματικό χρόνο, χρησιμοποιήθηκε πρακτικά σε παρουσίαση που έδωσε στέλεχος της Microsoft στo Τιανζίν της Κίνας. Το λογισμικό, μάλιστα, μπορεί ακόμα και να μιμείται τη χροιά της φωνής του ομιλητή.

Ένα πειραματικό σύστημα που μεταφράζει τα λόγια ενός αγγλόφωνου ομιλητή στα κινέζικα, σχεδόν σε πραγματικό χρόνο, χρησιμοποιήθηκε πρακτικά σε παρουσίαση που έδωσε στέλεχος της Microsoft στo Τιανζίν της Κίνας. Το λογισμικό, μάλιστα, μπορεί ακόμα και να μιμείται τη χροιά της φωνής του ομιλητή.

«Καθώς μιλούσα στα αγγλικά, το σύστημα συνδύαζε αυτόματα μια σειρά τεχνολογιών για να δώσει μια ικανοποιητική εμπειρία στους ακροατές -με τη δική μου φωνή να ακούγεται στα κινέζικα» γράφει σε εταιρικό ιστολόγιο ο Ρικ Ρασίντ, επικεφαλής Έρευνας στη Μicrosoft.

Τα πρώτα συστήματα αυτόματης μετάφρασης ομιλίας εμφανίστηκαν τη δεκαετία του 1970 και προσπαθούσαν να αντιστοιχίσουν την κυματομορφή της φωνής του χρήστη με γνωστές κυματομορφές σε μια άλλη γλώσσα.

Το σύστημα της Μicrosoft ακουλουθεί εντελώς διαφορετική προσέγγιση: στο πρώτο στάδιο, μετατρέπει την ομιλία σε γραπτό κείμενο, το οποίο μεταφράζεται στη συνέχεια στα κινέζικα λέξη προς λέξη. Στο επόμενο στάδιο, το λογισμικό αναδιατάσσει τις λέξεις στη σωστή σειρά ώστε να βγάζουν νόημα, και τις εκφέρει μιμούμενο τη χροιά της φωνής του ομιλητή.

Το σύστημα, επισήμανε ο Ρασίντ, συνδυάζει διάφορες προσεγγίσεις μετάφρασης, όπως τη «μοντελοποίηση Μάρκοφ» που επιτρέπει επιτρέπει στο σύστημα να μαθαίνει ακούγοντας πολλούς διαφορετικούς ομιλητές, καθώς και την τεχνική Deep Neural Networks, η οποία αναπτύχθηκε από τη Microsoft σε συνεργασία με το Πανεπιστήμιο του Τορόντο και βασίζεται στα λεγόμενα νευρωνικά δίκτυα, τα οποία μιμούνται την οργάνωση των νευρώνων του εγκεφάλου.

Ο Ρασίντ τόνισε πάντως ότι στη σημερινή του μορφή το σύστημα μεταφράζει λανθασμένα περίπου λέξη ανά επτά ή οκτώ. Τα λάθη είναι επομένως αρκετά, ωστόσο η ακρίβεια έχει αυξηθεί κατά 30% σε σχέση με προηγούμενες απόπειρες.

Η Microsoft, πάντως, δεν είναι η μόνη εταιρεία που ερευνά τις τεχνολογίες μηχανικής διερμηνείας. Ανάλογες τεχνολογίες αναπτύσσονται μεταξύ άλλων από τη Google και την AT&T, ενώ η ιαπωνική εταιρεία κινητής τηλεφωνίας NTT Docomo έχει παρουσιάσει ένα κινητό που επιτρέπει στους Ιάπωνες να μιλούν αγγλικά. Η διαφορά όμως είναι ότι στα συστήματα αυτά η φωνή του συστήματος έχει μηχανική χροιά.

Newsroom ΑΛΤΕΡ ΕΓΚΟ

Sports in

LIVE: Τενερίφη – Περιστέρι

Παρακολουθήστε live στις 19:00 την εξέλιξη της αναμέτρησης Τενερίφη – Περιστέρι για τον ημιτελικό του Final Four του Basketball Champions League. Tηλεοπτικά από Cosmote Sports 4.

Ακολουθήστε το in.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

in.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθύντρια Σύνταξης: Αργυρώ Τσατσούλη

Ιδιοκτησία - Δικαιούχος domain name: ΑΛΤΕΡ ΕΓΚΟ ΜΜΕ Α.Ε.

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 800745939, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: in@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

ΜΗΤ Αριθμός Πιστοποίησης Μ.Η.Τ.232442

Παρασκευή 26 Απριλίου 2024