Študija AI kaže, da stroji v temi raztrgajo v temi!
Študija AI kaže, da stroji v temi raztrgajo v temi!
Edinburgh, Vereinigtes Königreich - Sodobna umetna inteligenca (AI) je dosegla izjemen napredek, na primer na področju besedilnega položaja in programiranja. Vendar nova študija univerze v Edinburghu razkriva presenetljivo slabost: ti sistemi očitno ne morejo brati analognih ur. Preiskava, ki bo kmalu objavljena aprila, kaže, da so bili celo napredni modeli AI napačni v več kot 75 % primerov, ko je prepoznala čas na analognih številčnici. Zlasti ure z rimskimi števkami ali brez druge točke, v kateri je težava pogosto pri odkrivanju kazalcev in njihovih kotov na številčnici, poroča Google Gemini 2.0 in Antropic Claude 3.5. Vsak model se je soočil s slikami različnih ur. Modeli AI so bili vprašani: "Kdaj prikazuje uro na sliki?" Rezultati so pokazali zaskrbljujoča natančnost: Google Gemini 2.0 je dosegel najboljšo uspešnost v testu ure z 22,58 %, medtem ko je OpenAI GPT-1 v drugačnem kontekstu-analiza koledarskih slik, ki so zasukane z 80 %pravilnimi odgovori, kar pomeni tudi stopnjo napake 20 %, pojasnjuje gizmodo .
slabosti v času dojemanja Ki
Težave razlage analognih ur ponazarjajo meje modelov AI pri vsakodnevnih nalogah, ki intuitivno rešujejo ljudi. Po besedah Rohita Saxena, ki je bil na voljo, je treba te primanjkljaje nujno spoprijeti, da bi AI uporabili za kritne aplikacije. Napake so se pojavljale posebej pogosto pri urah z zapletenimi dizajni, kar ponazarja izzive, ki jih razvijalci pred izboljšanjem tehnologij AI.
Zanimivo opazovanje študije je, da modeli AI niso imeli težav z analizo koledarskih slik v enaki meri. To lahko kaže na različne mehanizme obdelave, ki vključujejo večpredstavnostne informacije, ki kažejo na prednosti multimodalnih modelov AI, ki medsebojno vplivajo na obdelavo različnih vrst podatkov, kot so besedilo, slika in biometrija, kot v bi4allconsulting
multimodalni AI in njihovi izzivi
Multimodalne modele je značilno, da združuje različne vire podatkov, da se omogoči močnejšo odločanje. Vendar se ti sistemi borijo z izzivi, kot so neravnovesje modalitet in potreba po velikih količinah podatkov o visoki kakovosti. Vendar pa bi lahko bila fleksibilnost multimodalne interakcije ključna tudi za izboljšano uporabniško izkušnjo na številnih področjih aplikacij.
Študija univerze v Edinburghu poudarja potrebo po raziskovalnih pristopih za premagovanje izzivov, s katerimi se modeli AI soočajo s prepoznavanjem slik, zlasti pri vsakdanjih nalogah, kot je branje časa. Še naprej je treba ugotoviti, kako bodo te ugotovitve vplivale na razvoj razvoja inteligentnih, bolj kontekstnih sistemov v prihodnosti.
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |