Τα νευρωνικά δίκτυα (neural networks) είναι σχεδιασμένα με τέτοιο τρόπο ώστε να αναγνωρίζουν εικόνες και να τις περιγράφουν και, με το πέρασμα του χρόνου, βελτιώνονται όλο και περισσότερο.
Μάλιστα, ένας developer, ο Kyle McDonald, δημοσίευσε πρόσφατα ένα βίντεο το οποίο δείχνει την εν λόγω διαδικασία και τους περιορισμούς της, σε πραγματικό χρόνο.
Χρησιμοποιώντας ένα MacBook Pro και μια τροποποιημένη έκδοση του προγράμματος NeuralTalk2, ο McDonald περιηγήθηκε στους δρόμους του Άμστερνταμ και κατέγραψε την προσπάθεια του υπολογιστή του να αναγνωρίσει τις εικόνες που έβλεπε.
Η διαδικασία περιγραφής όσων μας περιβάλλουν είναι αρκετά απλή για τον άνθρωπο, ωστόσο είναι αρκετά πολύπλοκη για έναν υπολογιστή, καθώς χρειάζεται να αναλύσει τη σκηνή, να αναγνωρίσει τα επιμέρους στοιχεία, καθώς και να εντοπίσει τη μεταξύ τους σχέση.
Όπως φαίνεται στο βίντεο, πολλές φορές το πρόγραμμα πραγματοποιεί επιτυχείς αναγνωρίσεις, παρέχοντας επικεφαλίδες όπως, λόγου χάρη, «σειρά από ποδήλατα παρκαρισμένα το ένα δίπλα στο άλλο» και «άντρας τρώει χοτ ντογκ στον δρόμο».
Ωστόσο, αρκετές από τις επικεφαλίδες που παρέχει το νευρωνικό δίκτυο είναι λανθασμένες και δεν ανταποκρίνονται στην πραγματικότητα, όπως, παραδείγματος χάρη, η δήλωση ότι ο McDonald φοράει κουστούμι και γραβάτα, ενώ στην πραγματικότητα φοράει φούτερ.
Το NeuralTalk2 είναι ένα πρόγραμμα ανοιχτού κώδικα, βασική ιδιότητα του οποίου είναι να παρέχει επικεφαλίδες προκειμένου να περιγράψει τις εικόνες που βλέπει. Βέβαια, δεν είναι ιδιαίτερα φιλικό προς τον χρήστη, καθώς απαιτεί αρκετό χρόνο για εξοικείωση. insomnia
0 Post a Comment:
إرسال تعليق