Μελέτη AI δείχνει: οι μηχανές είναι στο σκοτάδι όταν διαβάζουν ρολόγια!
Μια μελέτη δείχνει ότι τα μοντέλα τεχνητής νοημοσύνης δυσκολεύονται να διαβάσουν αναλογικά ρολόγια. Οι δοκιμές με 8 μοντέλα έδειξαν ακρίβεια μικρότερη από 25%.
Μελέτη AI δείχνει: οι μηχανές είναι στο σκοτάδι όταν διαβάζουν ρολόγια!
Η σύγχρονη τεχνητή νοημοσύνη (AI) έχει σημειώσει αξιοσημείωτη πρόοδο, για παράδειγμα στους τομείς του copywriting και του προγραμματισμού. Ωστόσο, μια νέα μελέτη από το Πανεπιστήμιο του Εδιμβούργου αποκαλύπτει μια εκπληκτική αδυναμία: αυτά τα συστήματα προφανώς δεν μπορούν να διαβάσουν αναλογικά ρολόγια. Η έρευνα, που θα δημοσιευθεί σύντομα τον Απρίλιο, δείχνει ότι ακόμη και τα προηγμένα μοντέλα τεχνητής νοημοσύνης έκαναν λάθος περισσότερο από το 75% των περιπτώσεων όσον αφορά την αναγνώριση της ώρας στα αναλογικά ρολόγια. Συγκεκριμένα, τα ρολόγια με λατινικούς αριθμούς ή χωρίς δεύτερο χέρι παρουσίαζαν μια μεγάλη πρόκληση, καθώς το πρόβλημα συχνά έγκειται στην αναγνώριση των δεικτών και των γωνιών τους στο καντράν, αναφέρει oe24.
Στη μελέτη δοκιμάστηκαν συνολικά επτά μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένων των OpenAI GPT-4, Google Gemini 2.0 και Anthropic Claude 3.5. Κάθε μοντέλο παρουσιάστηκε με εικόνες διαφορετικών στυλ ρολογιών. Τα μοντέλα AI ρωτήθηκαν: "Τι ώρα δείχνει το ρολόι στην εικόνα;" Τα αποτελέσματα έδειξαν ανησυχητική ακρίβεια: Το Google Gemini 2.0 είχε την καλύτερη απόδοση στη δοκιμή ρολογιού με 22,58%, ενώ το OpenAI GPT-1 έλαμψε σε διαφορετικό πλαίσιο - αναλύοντας εικόνες ημερολογίου - με 80% σωστές απαντήσεις, αλλά αυτό σημαίνει επίσης ποσοστό σφάλματος 20%, εξηγεί Gizmodo.
Αδυναμίες στην αντίληψη του χρόνου της τεχνητής νοημοσύνης
Οι δυσκολίες στην ερμηνεία των αναλογικών ρολογιών υπογραμμίζουν τους περιορισμούς των μοντέλων AI σε καθημερινές εργασίες που οι άνθρωποι επιλύουν διαισθητικά. Σύμφωνα με τον Rohit Saxena, συν-συγγραφέα της μελέτης, αυτές οι ελλείψεις πρέπει επειγόντως να αντιμετωπιστούν για να καταστεί η τεχνητή νοημοσύνη χρησιμοποιήσιμη για εφαρμογές κρίσιμες για το χρόνο. Τα σφάλματα ήταν ιδιαίτερα κοινά σε ρολόγια με περίπλοκα σχέδια, υπογραμμίζοντας τις προκλήσεις που αντιμετωπίζουν οι προγραμματιστές στη βελτίωση των τεχνολογιών AI.
Μια ενδιαφέρουσα παρατήρηση από τη μελέτη είναι ότι τα μοντέλα τεχνητής νοημοσύνης δεν είχαν προβλήματα να αναλύσουν τις εικόνες ημερολογίου στον ίδιο βαθμό. Αυτό θα μπορούσε να υποδεικνύει διαφορετικούς μηχανισμούς επεξεργασίας που ενσωματώνουν πληροφορίες πολυμέσων, υποδεικνύοντας τα πλεονεκτήματα των πολυτροπικών μοντέλων τεχνητής νοημοσύνης που αλληλεπιδρούν με την επεξεργασία διαφορετικών τύπων δεδομένων όπως κείμενο, εικόνα και βιομετρικά στοιχεία, όπως bi4allconsulting περιγράφεται.
Η πολυτροπική τεχνητή νοημοσύνη και οι προκλήσεις της
Τα πολυτροπικά μοντέλα χαρακτηρίζονται από το συνδυασμό διαφορετικών πηγών δεδομένων για να καταστεί δυνατή η πιο ισχυρή λήψη αποφάσεων. Ωστόσο, αυτά τα συστήματα παλεύουν με προκλήσεις όπως η ανισορροπία των τρόπων λειτουργίας και η ανάγκη για μεγάλες ποσότητες δεδομένων υψηλής ποιότητας. Ωστόσο, η ευελιξία της πολυτροπικής αλληλεπίδρασης θα μπορούσε επίσης να είναι ένα κλειδί για βελτιωμένη εμπειρία χρήστη σε πολλούς τομείς εφαρμογών.
Η μελέτη του Πανεπιστημίου του Εδιμβούργου υπογραμμίζει την ανάγκη για προσεγγίσεις που βασίζονται στην έρευνα για να ξεπεράσουν τις προκλήσεις που αντιμετωπίζουν τα μοντέλα τεχνητής νοημοσύνης κατά την αναγνώριση εικόνων, ιδιαίτερα σε καθημερινές εργασίες, όπως η αφήγηση του χρόνου. Μένει να δούμε πώς αυτά τα ευρήματα θα επηρεάσουν την ανάπτυξη εξυπνότερων συστημάτων με μεγαλύτερη επίγνωση του πλαισίου στο μέλλον.