Μοντέλο Τεχνητής Νοημοσύνης για τη μετάφραση ομιλίας μεταξύ δεκάδων γλωσσών

Η εταιρεία Meta Platforms META.O του Facebook, κυκλοφόρησε την Τρίτη ένα μοντέλο Τεχνητής Νοημοσύνης ικανό να μεταφράζει και να μεταγράφει ομιλία σε δεκάδες γλώσσες, ένα πιθανό δομικό στοιχείο για εργαλεία που θα επιτρέπει την επικοινωνία σε πραγματικό χρόνο πέρα από τα γλωσσικά σύνορα.

Η εταιρεία ανέφερε σε ανάρτηση στο ιστολόγιο, ότι το μοντέλο SeamlessM4T μπορεί να υποστηρίξει μεταφράσεις μεταξύ κειμένου και ομιλίας σε σχεδόν 100 γλώσσες, καθώς και πλήρη μετάφραση ομιλίας σε ομιλία για 35 γλώσσες, συνδυάζοντας τεχνολογία που προηγουμένως ήταν διαθέσιμη μόνο σε ξεχωριστά μοντέλα.

Ο διευθύνων σύμβουλος Μαρκ Ζούκερμπεργκ έχει πει, ότι οραματίζεται τέτοια εργαλεία που διευκολύνουν τις αλληλεπιδράσεις μεταξύ χρηστών από όλο τον κόσμο στο metaverse, το σύνολο των διασυνδεδεμένων εικονικών κόσμων στο οποίο ποντάρει το μέλλον της εταιρείας.

Η Meta διαθέτει το μοντέλο στο κοινό για μη εμπορική χρήση, αναφέρεται στην ανάρτηση στο ιστολόγιο.

Η μεγαλύτερη εταιρεία Μέσων Κοινωνικής Δικτύωσης στον κόσμο έχει κυκλοφορήσει φέτος έναν καταιγισμό κυρίως δωρεάν μοντέλων τεχνητής νοημοσύνης, συμπεριλαμβανομένου ενός μεγάλου γλωσσικού μοντέλου που ονομάζεται Llama και αποτελεί σοβαρή πρόκληση για τα ιδιόκτητα μοντέλα που πωλούνται από το MSFT.O OpenAI που υποστηρίζεται από τη Microsoft και το GOOGL.O της Google της Alphabet.

Ο Ζούκερμπεργκ λέει ότι ένα ανοιχτό οικοσύστημα Τεχνητής Νοημοσύνης λειτουργεί προς όφελος της Meta, καθώς η εταιρεία έχει περισσότερα να κερδίσει από την ουσιαστική ανάθεση από το πλήθος της δημιουργίας εργαλείων που απευθύνονται στους καταναλωτές για τις κοινωνικές της πλατφόρμες παρά από τη χρέωση της πρόσβασης στα μοντέλα.

Παρ' όλα αυτά, η Meta αντιμετωπίζει παρόμοια νομικά ζητήματα με την υπόλοιπη βιομηχανία γύρω από τα δεδομένα εκπαίδευσης που λαμβάνονται για τη δημιουργία των μοντέλων της.

Τον Ιούλιο, η κωμικός Sarah Silverman και δύο άλλοι συγγραφείς κατέθεσαν αγωγές παραβίασης πνευματικών δικαιωμάτων τόσο κατά της Meta όσο και κατά της OpenAI, κατηγορώντας τις εταιρείες ότι χρησιμοποίησαν τα βιβλία τους ως δεδομένα εκπαίδευσης χωρίς άδεια.

Για το μοντέλο SeamlessM4T, οι ερευνητές της Meta ανέφεραν σε ένα ερευνητικό έγγραφο ότι συγκέντρωσαν δεδομένα εκπαίδευσης ήχου από 4 εκατομμύρια ώρες "ακατέργαστου ήχου που προέρχεται από ένα δημόσια διαθέσιμο αποθετήριο δεδομένων από το διαδίκτυο", χωρίς να διευκρινίζουν ποιο αποθετήριο.

Εκπρόσωπος της Meta δεν απάντησε σε ερωτήσεις σχετικά με την προέλευση των δεδομένων ήχου.

Τα δεδομένα κειμένου προήλθαν από σύνολα δεδομένων που δημιουργήθηκαν πέρυσι και αντλούσαν περιεχόμενο από τη Wikipedia και συναφείς ιστότοπους, σύμφωνα με το ερευνητικό έγγραφο.