Studiul AI arată că mașinile se rup în întuneric în întuneric!
Studiul AI arată că mașinile se rup în întuneric în întuneric!
Edinburgh, Vereinigtes Königreich - Inteligența artificială modernă (AI) a înregistrat progrese remarcabile, de exemplu în domeniile poziției și programării textului. Cu toate acestea, un nou studiu realizat de Universitatea din Edinburgh dezvăluie o slăbiciune surprinzătoare: aparent aceste sisteme nu pot citi ceasuri analogice. Ancheta, care va fi publicată în curând în aprilie, arată că chiar și modelele avansate de AI au greșit în mai mult de 75 % din cazuri când a venit să recunoască timpul pe cadranuri analoge. În special, ceasuri cu cifre romane sau fără un al doilea punct în care problema constă adesea în detectarea indicatoarelor și a unghiurilor lor pe cadran, relatează Google Gemini 2.0 și Antropic Claude 3.5. Fiecare model s -a confruntat cu imagini cu diferite stiluri de ceas. Modelele AI au fost întrebate: „La ce oră se arată în poză?” Rezultatele au arătat o precizie îngrijorătoare: Google Gemini 2.0 a obținut cele mai bune performanțe în testul de ceas cu 22,58 %, în timp ce Openai GPT-1 într-un context diferit-Analiza imaginilor din calendar cu 80 %răspunsuri corecte, ceea ce înseamnă și o rată de eroare de 20 %, explică gizmodo .
slăbiciuni în percepția timpului Ki
Dificultățile de interpretare a ceasurilor analogice ilustrează limitele modelelor AI în sarcinile de zi cu zi care rezolvă intuitiv oamenii. Potrivit lui Rohit Saxena, co -autor al studiului, aceste deficite trebuie să fie abordate urgent pentru a face AI -ul utilizabil pentru aplicații critice de timp. Erorile au apărut în special în ceasurile cu modele complicate, ceea ce ilustrează provocările pe care dezvoltatorii sunt în fața îmbunătățirii tehnologiilor AI.
O observație interesantă a studiului este aceea că modelele AI nu au avut probleme cu analiza imaginilor din calendar în aceeași măsură. Acest lucru ar putea indica diferite mecanisme de procesare care integrează informații multimedia, ceea ce indică avantajele modelelor AI multimodale, care interacționează prin procesarea diferitelor tipuri de date, cum ar fi text, imagine și biometrie, ca în
Modelele multimodale sunt caracterizate prin combinarea diferitelor surse de date pentru a permite luarea de decizii mai robuste. Cu toate acestea, aceste sisteme se luptă cu provocări, cum ar fi dezechilibrul modalităților și nevoia de cantități mari de date de înaltă calitate. Cu toate acestea, flexibilitatea interacțiunii multimodale ar putea fi, de asemenea, o cheie pentru o experiență îmbunătățită a utilizatorului în numeroase domenii de aplicație. Studiul de la Universitatea din Edinburgh subliniază necesitatea unor abordări bazate pe cercetare pentru a depăși provocările cu care modelele AI se confruntă cu recunoașterea imaginilor, în special în sarcinile de zi cu zi, cum ar fi citirea timpului. Rămâne de văzut cum aceste constatări vor influența dezvoltarea sistemelor inteligente și mai conștiente de context în viitor. AI multimodal și provocările lor
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |