AI -uuring näitab, et masinad rippivad pimeduses pimeduses!

AI -uuring näitab, et masinad rippivad pimeduses pimeduses!

Edinburgh, Vereinigtes Königreich - Kaasaegne tehisintellekt (AI) on teinud märkimisväärseid edusamme, näiteks tekstipositsiooni ja programmeerimise valdkonnas. Edinburghi ülikooli uus uuring näitab aga üllatavat nõrkust: ilmselt ei suuda need süsteemid analoogseid kellasid lugeda. Peagi aprillis avaldatud uurimine näitab, et isegi arenenud AI -mudelid olid valedel kui 75 % -l juhtudest, kui tegemist oli analoogsete valimiste aja äratundmiseks. Täpsemalt, Rooma numbritega või ilma teise punktita, kus probleem seisneb sageli osutide ja nende nurkade tuvastamisel, teatab Google Gemini 2.0 ja antropiline Claude 3.5. Iga mudel on silmitsi erinevate kellastiilidega piltidega. AI -mudelitelt küsiti: "Mis kell pildil olev kella näitab?" Tulemused näitasid murettekitavat täpsust: Google Gemini 2.0 oli saavutanud parima jõudluse kella testis 22,58 %-ga, samas kui OpenAi GPT-1 teises kontekstis-kalendripiltide analüüs 80 %õigete vastustega, mis tähendab ka veamäär 20 %, selgitab gizmodo .

nõrkused Ki

aja tajumisel

Analoogkellade tõlgendamise raskused illustreerivad AI mudelite piire igapäevastes ülesannetes, mis intuitiivselt lahendavad inimesi. Uuringu kaasratori Rohit Saxena sõnul tuleb neid puudujääke kiiresti lahendada, et muuta AI ajakriitilisteks rakendusteks kasutatavaks. Vead ilmnesid eriti sageli keerukate disainilahendustega kellades, mis illustreerib väljakutseid, millega arendajad AI -tehnoloogiate paranemise ees on.

Uuringu huvitav tähelepanek on see, et AI mudelitel polnud kalendripiltide analüüsiga probleeme. See võib näidata erinevaid töötlemismehhanisme, mis integreerivad multimeediumiteavet, mis näitab multimodaalsete AI-mudelite eeliseid, mis interakteeruvad erinevate andmetüüpide, näiteks teksti, pildi ja biomeetria töötlemise kaudu, nagu näiteks

multimodaalne AI ja nende väljakutsed

Multimodaalseid mudeleid iseloomustatakse erinevate andmeallikate ühendamise teel, et võimaldada kindlamat otsuste tegemist. Need süsteemid võitlevad aga väljakutsetega, näiteks mooduste tasakaalustamatus ja vajadus suures koguses kõrgekvaliteediliste andmete järele. Kuid multimodaalse interaktsiooni paindlikkus võib olla ka võti parema kasutajakogemuse jaoks paljudes rakenduspiirkondades.

Edinburghi ülikooli uuring rõhutab vajadust uurimispõhiste lähenemisviiside järele, et üle saada väljakutsetest, millega AI-mudelid puutuvad silmitsi piltide äratundmisega, eriti igapäevastes ülesannetes nagu aja lugemine. Jääb üle vaadata, kuidas need leiud mõjutavad tulevikus intelligentsema, konteksti -teadlike süsteemide arengut.

Details
OrtEdinburgh, Vereinigtes Königreich
Quellen