AI -studien viser at maskiner ripper i mørket i mørket!
AI -studien viser at maskiner ripper i mørket i mørket!
Edinburgh, Vereinigtes Königreich - Moderne kunstig intelligens (AI) har gjort bemerkelsesverdig fremgang, for eksempel innen tekstposisjon og programmering. En ny studie fra University of Edinburgh avslører imidlertid en overraskende svakhet: disse systemene kan tilsynelatende ikke lese analoge klokker. Etterforskningen, som snart vil bli publisert i april, viser at til og med avanserte AI -modeller var feil i mer enn 75 % av tilfellene når det gjaldt å anerkjenne tiden på analoge skiver. Spesielt klokker med romerske sifre eller uten et annet punkt der problemet ofte ligger i deteksjonen av pekerne og deres vinkler på skiven, rapporterer Google Gemini 2.0 og antropisk Claude 3.5. Hver modell har blitt konfrontert med bilder av forskjellige klokkestiler. AI -modellene ble spurt: "Hva tid viser klokken på bildet?" Resultatene viste en bekymringsfull nøyaktighet: Google Gemini 2.0 hadde oppnådd den beste ytelsen i klokkeprøven med 22,58 %, mens Openai GPT-1 i en annen kontekst-analysen av kalenderbilder-rist med 80 %riktige svar, som også betyr en feilrate på 20 %, forklarer gizmodo .
Svakheter i den tidsoppfatningen av ki
Vanskelighetene med å tolke analoge klokker illustrerer grensene for AI -modellene i hverdagsoppgaver som intuitivt løser mennesker. I følge Rohit Saxena, medforfatter av studien, må disse underskuddene raskt takles for å gjøre AI brukbare for tidskritiske applikasjoner. Feil oppstod spesielt ofte i klokker med kompliserte design, noe som illustrerer utfordringene som utviklere er foran forbedringen i AI -teknologier.
En interessant observasjon av studien er at AI -modeller ikke hadde noen problemer med analysen av kalenderbilder i samme grad. Dette kan indikere forskjellige prosesseringsmekanismer som integrerer multimediainformasjon, som indikerer fordelene ved multimodale AI -modeller, som samhandler gjennom behandlingen av forskjellige datatyper som tekst, bilde og biometri, som i bi4allconsulting
Multimodal AI og deres utfordringer
Multimodale modeller er preget av å kombinere forskjellige datakilder for å muliggjøre mer robust beslutningstaking. Imidlertid kjemper disse systemene med utfordringer, for eksempel ubalansen i modaliteter og behovet for store mengder data med høy kvalitet. Imidlertid kan fleksibiliteten i multimodal interaksjon også være en nøkkel til en forbedret brukeropplevelse på mange applikasjonsområder.
Studien fra University of Edinburgh understreker behovet for forskningsbaserte tilnærminger for å overvinne utfordringene AI-modeller blir konfrontert med anerkjennelse av bilder, spesielt i hverdagslige oppgaver som å lese tiden. Det gjenstår å se hvordan disse funnene vil påvirke utviklingen av utviklingen av intelligente, mer kontekst -bevisste systemer i fremtiden.
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |