AI -undersøgelse viser, at maskiner ripper i mørket i mørket!

AI -undersøgelse viser, at maskiner ripper i mørket i mørket!

Edinburgh, Vereinigtes Königreich - Modern Artificial Intelligence (AI) har gjort bemærkelsesværdige fremskridt, for eksempel inden for tekstposition og programmering. En ny undersøgelse fra University of Edinburgh afslører imidlertid en overraskende svaghed: disse systemer kan tilsyneladende ikke læse analoge ure. Undersøgelsen, der snart vil blive offentliggjort i april, viser, at selv avancerede AI -modeller var forkerte i mere end 75 % af tilfældene, når det kom til at anerkende tiden på analoge opkald. Især er ure med romerske cifre eller uden et andet punkt, hvor problemet ofte ligger i detekteringen af ​​pointerne og deres vinkler på urskiven,

I alt syv AI-modeller blev testet i undersøgelsen, herunder Openaai GPT-4, Google Gemini 2.0 og Anthropic Claude 3.5. Hver model er blevet konfronteret med billeder af forskellige ur -style. AI -modellerne blev spurgt: "Hvad tid viser uret på billedet?" Resultaterne viste en bekymrende nøjagtighed: Google Gemini 2.0 havde opnået den bedste ydelse i uretest med 22,58 %, mens Openai GPT-1 i en anden kontekst-analysen af ​​kalenderbilleder-form med 80 %korrekte svar, hvilket også betyder en fejlrate på 20 %, forklarer gizmodo .

svagheder i tidsopfattelsen af ​​ki

Vanskelighederne ved at fortolke analoge ure illustrerer grænserne for AI -modellerne i hverdagens opgaver, der intuitivt løser mennesker. Ifølge Rohit Saxena, coautor for undersøgelsen, skal disse underskud presserende håndteres for at gøre AI brugbare til tidskritiske anvendelser. Fejl forekom især ofte i ure med komplicerede design, der illustrerer de udfordringer, som udviklere er foran forbedringen i AI -teknologier.

En interessant observation af undersøgelsen er, at AI -modeller ikke havde problemer med analysen af ​​kalenderbilleder i samme omfang. Dette kan indikere forskellige behandlingsmekanismer, der integrerer multimedieinformation, hvilket indikerer fordelene ved multimodale AI -modeller, der interagerer gennem behandling af forskellige datatyper, såsom tekst, billede og biometri, som i bi4allconsulting

multimodal AI og deres udfordringer

Multimodale modeller er kendetegnet ved at kombinere forskellige datakilder for at muliggøre mere robust beslutning -at skabe. Imidlertid kæmper disse systemer med udfordringer, såsom ubalance mellem modaliteter og behovet for store mængder af data med høj kvalitet. Imidlertid kan fleksibiliteten i multimodal interaktion også være en nøgle til en forbedret brugeroplevelse inden for adskillige applikationsområder.

Undersøgelsen fra University of Edinburgh understreger behovet for forskningsbaserede tilgange til at overvinde de udfordringer, som AI-modeller konfronteres med anerkendelsen af ​​billeder, især i hverdagens opgaver, såsom at læse tiden. Det er tilbage at se, hvordan disse fund vil påvirke udviklingen af ​​udviklingen af ​​intelligente, mere kontekst -bevidste systemer i fremtiden.

Details
OrtEdinburgh, Vereinigtes Königreich
Quellen

Kommentare (0)