AI studija pokazuje da se strojevi u mraku puknu u mraku!
AI studija pokazuje da se strojevi u mraku puknu u mraku!
Edinburgh, Vereinigtes Königreich - Moderna umjetna inteligencija (AI) postigla je izuzetan napredak, na primjer, u područjima pozicije i programiranja teksta. Međutim, nova studija Sveučilišta u Edinburghu otkriva iznenađujuću slabost: ovi sustavi očito ne mogu čitati analogne satove. Istraga, koja će uskoro biti objavljena u travnju, pokazuje da su čak i napredni AI modeli bili u krivu u više od 75 % slučajeva kada je u pitanju prepoznavanje vremena na analognim biranjem. Konkretno, satovi s rimskim znamenkama ili bez druge točke u kojoj se problem često leži u otkrivanju pokazivača i njihovih kutova na biračkom, izvještava Google GEMINI 2.0 i Antrop Claude 3.5. Svaki se model suočio sa slikama različitih satova. AI modeli su pitali: "U koje vrijeme se satni prikazuje na slici?" Rezultati su pokazali zabrinjavajuću točnost: Google GEMINI 2.0 postigao je najbolje performanse u testu sata sa 22,58 %, dok je OpenAi GPT-1 u različitom kontekstu-analiza kalendarskih slika shvaćenih s 80 %točnih odgovora, što također znači stopu pogreške od 20 %, objašnjava gizmodo .
Slabosti u vremenskoj percepciji ki
Poteškoće u tumačenju analognih satova ilustriraju granice AI modela u svakodnevnim zadacima koji intuitivno rješavaju ljude. Prema Rohitu Saxena, ko -autoru studije, ove se deficite hitno trebaju riješiti kako bi AI postala upotrebljiva za vremensko -kritičke primjene. Pogreške su se posebno često događale u satovima sa kompliciranim dizajnom, što ilustrira izazove da su programeri ispred poboljšanja AI tehnologija.
Zanimljivo promatranje studije je da AI modeli nisu imali problema s analizom kalendarskih slika u istoj mjeri. To bi moglo ukazivati na različite mehanizme obrade koji integriraju multimedijske informacije, što ukazuje na prednosti multimodalnih AI modela, koji komuniciraju kroz obradu različitih vrsta podataka kao što su tekst, slika i biometrija, kao u bi4AllConsulting
Multimodalni AI i njihovi izazovi
Multimodalni modeli karakteriziraju kombiniranje različitih izvora podataka kako bi se omogućio robusniji donošenje odluke. Međutim, ovi se sustavi bore s izazovima, poput neravnoteže modaliteta i potrebe za velikim količinama podataka visoke kvalitete. Međutim, fleksibilnost multimodalne interakcije također bi mogla biti ključ poboljšanog korisničkog iskustva u brojnim područjima aplikacije.
Studija Sveučilišta u Edinburghu naglašava potrebu za pristupima utemeljenim na istraživanjima kako bi se prevladali izazovi s kojima se AI modeli suočavaju s prepoznavanjem slika, posebno u svakodnevnim zadacima poput čitanja vremena. Ostaje da se vidi kako će ovi nalazi utjecati na razvoj razvoja inteligentnih, kontekstnih -svjesnijih sustava u budućnosti.
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |
Kommentare (0)