Σύνταξη - Επιμέλεια: Στέλιος Βασιλούδης
Οι μετασχηματιστές - μοντέλα δεδομένων που βασίζονται σε νευρωνικά δίκτυα θα αλλάξουν ριζικά τον τρόπο με τον οποίο αλληλοεπιδρούν οι μηχανές με μας. Η τεχνητή νοημοσύνη έχει υποσχεθεί πολλά, αλλά υπάρχει κάτι που την εμποδίζει να χρησιμοποιηθεί εύκολα και με επιτυχία από δισεκατομμύρια ανθρώπους: ένας απογοητευτικός αγώνας για τους ανθρώπους και τις μηχανές να καταλάβουν ο ένας τον άλλον, στη φυσική γλώσσα.
Αυτό αλλάζει τώρα, χάρη στην άφιξη μεγάλων μοντέλων γλώσσας που τροφοδοτούνται από αρχιτεκτονικές μετασχηματιστών, μια από τις πιο σημαντικές ανακαλύψεις τεχνητής νοημοσύνης τα τελευταία 20 χρόνια. Οι μετασχηματιστές είναι νευρωνικά δίκτυα σχεδιασμένα να μοντελοποιούν διαδοχικά δεδομένα και να δημιουργούν μια πρόβλεψη για το τι θα ακολουθήσει σε μια σειρά. Ο πυρήνας της επιτυχίας τους είναι η ιδέα της «προσοχής», η οποία επιτρέπει στον μετασχηματιστή να «προσέχει» τα πιο σημαντικά χαρακτηριστικά μιας εισόδου αντί να προσπαθεί να επεξεργαστεί τα πάντα.
Τα νέα μοντέλα έχουν προσφέρει σημαντικές βελτιώσεις σε εφαρμογές που χρησιμοποιούν φυσική γλώσσα, όπως μετάφραση γλώσσας, περίληψη, ανάκτηση πληροφοριών και το πιο σημαντικό, δημιουργία κειμένου. Στο παρελθόν, το καθένα απαιτούσε κατά παραγγελία αρχιτεκτονικές. Τώρα οι μετασχηματιστές προσφέρουν αποτελέσματα τελευταίας τεχνολογίας, σε όλους τους τομείς.
Αν και η Google πρωτοστάτησε στην αρχιτεκτονική μετασχηματιστών, το OpenAI έγινε το πρώτο που επέδειξε τη δύναμή του σε κλίμακα το 2020, με την κυκλοφορία του GPT-3 (Generative Pre-Trained Transformer 3). Εκείνη την εποχή, ήταν το μεγαλύτερο μοντέλο γλώσσας που δημιουργήθηκε ποτέ. Η ικανότητα του GPT-3 να παράγει κείμενο που μοιάζει με ανθρώπινο προκάλεσε ένα κύμα ενθουσιασμού - και ήταν μόνο η αρχή. Τα μεγάλα γλωσσικά μοντέλα βελτιώνονται τώρα με πραγματικά εντυπωσιακό ρυθμό.
Ο «αριθμός των παραμέτρων» είναι γενικά αποδεκτός ως ένας κατά προσέγγιση τρόπος μέτρησης των δυνατοτήτων ενός μοντέλου. Μέχρι στιγμής, έχουμε δει μοντέλα να αποδίδουν καλύτερα σε ένα ευρύ φάσμα εργασιών καθώς κλιμακώνεται ο αριθμός των παραμέτρων. Τα μοντέλα αυξάνονται σχεδόν κατά μια τάξη μεγέθους κάθε χρόνο τα τελευταία πέντε χρόνια, επομένως δεν αποτελεί έκπληξη το γεγονός ότι τα αποτελέσματα είναι εντυπωσιακά. Ωστόσο, αυτά τα πολύ μεγάλα μοντέλα είναι ακριβά στην παραγωγή.
Αυτό που είναι πραγματικά αξιοσημείωτο είναι ότι, τον περασμένο χρόνο, έγιναν μικρότερα και απίστευτα πιο αποτελεσματικά. Τώρα βλέπουμε εντυπωσιακές επιδόσεις από μικρά μοντέλα, που είναι πολύ φθηνότερα στη χρήση. Πολλά είναι ανοιχτού κώδικα, μειώνοντας περαιτέρω τα εμπόδια στον πειραματισμό και την ανάπτυξη αυτών των νέων μοντέλων τεχνητής νοημοσύνης. Αυτό, φυσικά, σημαίνει ότι θα ενσωματωθούν ευρύτερα σε εφαρμογές και υπηρεσίες που θα χρησιμοποιούμε καθημερινά.
Θα μπορούν ολοένα και περισσότερο να δημιουργούν πολύ υψηλής ποιότητας κείμενο, εικόνες, ήχο και περιεχόμενο βίντεο. Αυτό το νέο κύμα τεχνητής νοημοσύνης θα επαναπροσδιορίσει το τι μπορούν να κάνουν οι υπολογιστές για τους χρήστες τους, απελευθερώνοντας έναν χείμαρρο προηγμένων δυνατοτήτων σε υπάρχοντα και ριζικά νέα προϊόντα.
Ο τομέας που ενθουσιάζει περισσότερο είναι η γλώσσα. Σε ολόκληρη την ιστορία των υπολογιστών, οι άνθρωποι έπρεπε να εισάγουν (με κόπο) τις σκέψεις τους σε αυτούς, χρησιμοποιώντας διεπαφές σχεδιασμένες για την τεχνολογία, όχι για τους ίδιους. Με αυτό το κύμα ανακαλύψεων, το 2023 θα αρχίσουμε να συνομιλούμε με μηχανές στη γλώσσα μας - άμεσα και ολοκληρωμένα. Τελικά, θα μπορούμε να έχουμε πραγματικά ευχάριστες και εύκολες αλληλεπιδράσεις συνομιλίας με όλες τις συσκευές μας. Αυτό υπόσχεται να επαναπροσδιορίσει θεμελιωδώς την αλληλεπίδραση ανθρώπου - μηχανής.
Τις τελευταίες δεκαετίες, δικαίως η προσπάθεια έχει επικεντρωθεί στο να διδαχθούν οι άνθρωποι πώς να κωδικοποιούν - στην πραγματικότητα να μάθουν τη γλώσσα των υπολογιστών. Αυτό θα παραμείνει σημαντικό. Το 2023, όμως, θα αρχίσουμε να αντιστρέφουμε αυτό το σενάριο και οι υπολογιστές θα μιλούν τη γλώσσα μας. Αυτό θα διευρύνει μαζικά την πρόσβαση σε εργαλεία, για δημιουργικότητα, μάθηση και παιχνίδι.
Καθώς η τεχνητή νοημοσύνη αναδύεται επιτέλους σε μια εποχή χρησιμότητας, οι ευκαιρίες για νέα προϊόντα που προέρχονται από αυτή, είναι τεράστιες. Σύντομα, θα ζήσουμε σε έναν κόσμο όπου, ανεξάρτητα από τις ικανότητες προγραμματισμού μας, οι κύριοι περιορισμοί θα είναι απλώς η περιέργεια και η φαντασία μας.
Πηγή: Wired
0 Post a Comment:
إرسال تعليق