Lo studio di intelligenza artificiale mostra che le macchine strappano l'oscurità nel buio!
Lo studio di intelligenza artificiale mostra che le macchine strappano l'oscurità nel buio!
Edinburgh, Vereinigtes Königreich - L'intelligenza artificiale moderna (AI) ha fatto notevoli progressi, ad esempio nelle aree della posizione e della programmazione del testo. Tuttavia, un nuovo studio dell'Università di Edimburgo rivela una debolezza sorprendente: questi sistemi apparentemente non possono leggere orologi analogici. L'indagine, che sarà presto pubblicata ad aprile, mostra che anche i modelli AI avanzati erano sbagliati in oltre il 75 % dei casi quando si è trattato di riconoscere il tempo su quadranti analoghi. In particolare, gli orologi con cifre romane o senza un secondo punto in cui il problema risiede spesso nel rilevamento dei puntatori e dei loro angoli sul quadrante, riferisce Google Gemini 2.0 e Claude 3.5 antropico. Ogni modello si è confrontato con immagini di diversi stili di orologio. Ai modelli AI è stato chiesto: "A che ora mostra l'orologio nella foto?" I risultati hanno mostrato una precisione preoccupante: Google Gemini 2.0 ha raggiunto le migliori prestazioni nel test dell'orologio con il 22,58 %, mentre Openai GPT-1 in un contesto diverso, l'analisi delle immagini del calendario con risposte corrette all'80 %, che significa anche un tasso di errore del 20 %, spiega gizmodo .
punti deboli nella percezione del tempo del ki
Le difficoltà nell'interpretazione degli orologi analogici illustrano i limiti dei modelli AI nei compiti di tutti i giorni che risolvono intuitivamente le persone. Secondo Rohit Saxena, co -autore dello studio, questi deficit devono essere urgenti per essere affrontati per rendere l'IA utilizzabile per le applicazioni critiche. Gli errori si sono verificati particolarmente spesso negli orologi con progetti complicati, che illustrano le sfide che gli sviluppatori sono di fronte al miglioramento delle tecnologie di intelligenza artificiale.
Un'osservazione interessante dello studio è che i modelli di intelligenza artificiale non hanno avuto problemi con l'analisi delle immagini del calendario nella stessa misura. This could indicate different processing mechanisms that integrate multimedia information, which indicates the advantages of multimodal AI models, which interact through the processing of different data types such as text, image and biometry, as in Bi4allconsulting
AI multimodale e le loro sfide
I modelli multimodali sono caratterizzati combinando diverse fonti di dati per consentire un processo decisionale più robusto. Tuttavia, questi sistemi stanno combattendo con sfide, come lo squilibrio delle modalità e la necessità di grandi quantità di dati di alta qualità. Tuttavia, la flessibilità dell'interazione multimodale potrebbe anche essere una chiave per un'esperienza utente migliorata in numerose aree di applicazione.
Lo studio dell'Università di Edimburgo sottolinea la necessità di approcci basati sulla ricerca per superare le sfide con cui i modelli AI si confrontano con il riconoscimento delle immagini, specialmente in compiti quotidiani come la lettura del tempo. Resta da vedere come questi risultati influenzeranno lo sviluppo dello sviluppo di sistemi intelligenti e più comuni di contesto in futuro.
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |
Kommentare (0)