Μια νέα έρευνα της Microsoft σε συνεργασία με το πανεπιστήμιο του Toronto πρόκειται σύντομα να φέρει επανάσταση στην αυτόματη μετάφραση αφού όχι μόνο μεταφράζει την ομιλία σε πραγματικό χρόνο, αλλά χρησιμοποιεί και την πραγματική φωνή του χρήστη μέσω text-to-speech.
Η νέα τεχνολογία ονομάζεται Deep Neural Networks και μιμείται τον τρόπο που λειτουργεί ο ανθρώπινος εγκέφαλος, επιτρέποντας έτσι πολύ πιο διακριτική αναγνώριση ομιλίας. Είναι σχεδιασμένη να μπορεί να ξεχωρίζει σημαντικές διαφορές στον τρόπο που μιλούν διαφορετικοί άνθρωποι, αναγνωρίζοντας διάφορες λέξεις με εξαιρετική ακρίβεια ανεξάρτητα από τον τονισμό, την προφορά του χρήστη ή το νόημα της. Η επίδειξη της έγινε από τον Richard Rashid, επικεφαλής του τμήματος ερευνών της Microsoft, μπροστά σε 2.000 φοιτητές στην Κίνα.
Η πρακτική αξία ενός τέτοιου συστήματος είναι τεράστια. Για τους επαγγελματίες ταξιδιώτες αλλά και τους τουρίστες που δεν γνωρίζουν την μητρική γλώσσα της χώρας όπου επισκέπτονται μπορεί να κάνει μεγάλη διαφορά. Ακόμα και για τους μετανάστες, η εκμάθηση μιας νέας γλώσσας συχνά είναι ένα από τα μεγαλύτερα εμπόδια της αφομοίωσης τους.
Γι’αυτό το λόγο τόσο η Microsoft όσο και η Google δουλεύουν για χρόνια για να αναπτύξουν ένα σύστημα μετάφρασης σε πραγματικό χρόνο. Η παρουσίαση του Rashid δείχνει πως η Microsoft μάλλον θα είναι η πρώτη που θα τα καταφέρει αφού σύμφωνα με αυτόν, η ακρίβεια της μετάφρασης έχει βελτιωθεί κατά 30% σε σχέση με παλαιότερες τεχνολογίες, με ποσοστό σφάλματος μόλις μια στις επτά λέξεις, περίπου 13%-14%.
Στην πραγματικότητα όμως η συγκεκριμένη τεχνολογία δεν αποτελεί κάποιο μελλοντικό προϊόν της εταιρείας, όχι ακόμα τουλάχιστον, αλλά απλά ένα «proof of concept». Όπως είπε ο Rashid, «Η δουλειά είναι προϊόν έρευνας για να ανακαλύψουμε μέχρι που μπορούμε να διευρύνουμε τα όρια μας» είπε εκπρόσωπος της Microsoft.