AI -studie toont aan dat machines in de duisternis in het donker scheuren!
AI -studie toont aan dat machines in de duisternis in het donker scheuren!
Edinburgh, Vereinigtes Königreich - Moderne kunstmatige intelligentie (AI) heeft opmerkelijke vooruitgang geboekt, bijvoorbeeld op het gebied van tekstpositie en programmering. Een nieuwe studie van de Universiteit van Edinburgh onthult echter een verrassende zwakte: deze systemen kunnen blijkbaar geen analoge horloges lezen. Het onderzoek, dat binnenkort in april zal worden gepubliceerd, toont aan dat zelfs geavanceerde AI -modellen in meer dan 75 % van de gevallen verkeerd waren als het ging om de tijd op analoge wijzerplaten. In het bijzonder, horloges met Romeinse cijfers of zonder een tweede punt waarin het probleem vaak ligt in de detectie van de aanwijzingen en hun hoeken op de wijzerplaat, meldt Google Gemini 2.0 en antropische Claude 3.5. Elk model is geconfronteerd met foto's van verschillende klokstijlen. De AI -modellen werd gevraagd: "Hoe laat toont de horloge op de foto?" De resultaten toonden een zorgwekkende nauwkeurigheid: Google Gemini 2.0 had de beste prestaties in de kloktest behaald met 22,58 %, terwijl OpenAI GPT-1 in een andere context-de analyse van agenda-afbeeldingen met 80 %correcte antwoorden, wat ook betekent dat een foutenpercentage van 20 %betekent, verklaart gizmodo .
Zwakke punten in de tijdperceptie van de ki
De moeilijkheden om analoge horloges te interpreteren illustreren de grenzen van de AI -modellen in dagelijkse taken die mensen intuïtief oplossen. Volgens Rohit Saxena, CO -auteur van de studie, moeten deze tekorten dringend worden aangepakt om AI bruikbaar te maken voor tijd -critische toepassingen. Fouten kwamen vooral vaak voor in horloges met gecompliceerde ontwerpen, wat de uitdagingen illustreert die ontwikkelaars voor de verbetering van AI -technologieën staan.
Een interessante observatie van de studie is dat AI -modellen geen problemen hadden met de analyse van kalenderbeelden in dezelfde mate. Dit kan wijzen op verschillende verwerkingsmechanismen die multimedia -informatie integreren, wat de voordelen van multimodale AI -modellen aangeeft, die interageren door de verwerking van verschillende gegevenstypen zoals tekst, afbeelding en biometrie, zoals in bi4allconsulting
multimodale AI en hun uitdagingen
Multimodale modellen worden gekenmerkt door verschillende gegevensbronnen te combineren om een robuustere beslissing mogelijk te maken. Deze systemen vechten echter met uitdagingen, zoals de onbalans van modaliteiten en de behoefte aan grote hoeveelheden gegevens van hoge kwaliteit. De flexibiliteit van multimodale interactie kan echter ook een sleutel zijn tot een verbeterde gebruikerservaring in tal van applicatiegebieden.
De studie van de Universiteit van Edinburgh benadrukt de noodzaak van op onderzoek gebaseerde benaderingen om de uitdagingen te overwinnen waarmee AI-modellen worden geconfronteerd met de erkenning van afbeeldingen, vooral bij dagelijkse taken zoals het lezen van de tijd. Het valt nog te bezien hoe deze bevindingen de ontwikkeling van de ontwikkeling van intelligente, meer context -bewuste systemen in de toekomst zullen beïnvloeden.
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |
Kommentare (0)