AI-onderzoek toont aan: machines tasten in het donker wanneer ze klokken lezen!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Uit onderzoek blijkt dat AI-modellen moeite hebben met het lezen van analoge klokken. Tests met 8 modellen lieten een nauwkeurigheid van minder dan 25% zien.

AI-onderzoek toont aan: machines tasten in het donker wanneer ze klokken lezen!

Moderne kunstmatige intelligentie (AI) heeft opmerkelijke vooruitgang geboekt, bijvoorbeeld op het gebied van copywriting en programmeren. Een nieuwe studie van de Universiteit van Edinburgh onthult echter een verrassende zwakte: deze systemen kunnen blijkbaar geen analoge klokken lezen. Uit het onderzoek, dat binnenkort in april wordt gepubliceerd, blijkt dat zelfs geavanceerde AI-modellen het in meer dan 75% van de gevallen bij het verkeerde eind hadden als het ging om het herkennen van de tijd op analoge wijzerplaten. Vooral horloges met Romeinse cijfers of zonder secondewijzer vormden een grote uitdaging, omdat het probleem vaak ligt in het herkennen van de wijzers en hun hoeken op de wijzerplaat, meldt oe24.

In het onderzoek zijn in totaal zeven AI-modellen getest, waaronder OpenAI GPT-4, Google Gemini 2.0 en Anthropic Claude 3.5. Elk model werd gepresenteerd met afbeeldingen van verschillende horlogestijlen. Aan de AI-modellen werd gevraagd: “Hoe laat geeft de klok op de foto aan?” De resultaten lieten een zorgwekkende nauwkeurigheid zien: Google Gemini 2.0 had de beste prestaties in de kloktest met 22,58%, terwijl OpenAI GPT-1 in een andere context schitterde (bij het analyseren van kalenderafbeeldingen) met 80% correcte antwoorden, maar dit betekent ook een foutenpercentage van 20%, legt uit Gizmodo.

Zwakke punten in de tijdsperceptie van AI

De moeilijkheden bij het interpreteren van analoge klokken benadrukken de beperkingen van AI-modellen bij alledaagse taken die mensen intuïtief oplossen. Volgens Rohit Saxena, co-auteur van het onderzoek, moeten deze tekortkomingen dringend worden aangepakt om AI bruikbaar te maken voor tijdkritische toepassingen. Fouten kwamen vooral vaak voor bij horloges met ingewikkelde ontwerpen, wat de uitdagingen benadrukte waarmee ontwikkelaars worden geconfronteerd bij het verbeteren van AI-technologieën.

Een interessante observatie uit het onderzoek is dat AI-modellen geen problemen hadden met het in dezelfde mate analyseren van kalenderafbeeldingen. Dit zou kunnen duiden op verschillende verwerkingsmechanismen die multimedia-informatie integreren, wat wijst op de voordelen van multimodale AI-modellen die op elkaar inwerken door verschillende soorten gegevens te verwerken, zoals tekst, beeld en biometrie, zoals in bi4alladvies wordt beschreven.

Multimodale AI en zijn uitdagingen

Multimodale modellen worden gekenmerkt door het combineren van verschillende gegevensbronnen om robuustere besluitvorming mogelijk te maken. Deze systemen kampen echter met uitdagingen zoals de onevenwichtigheid van de modaliteiten en de behoefte aan grote hoeveelheden gegevens van hoge kwaliteit. De flexibiliteit van multimodale interactie zou echter ook een sleutel kunnen zijn tot een betere gebruikerservaring in tal van toepassingsgebieden.

Het onderzoek van de Universiteit van Edinburgh benadrukt de noodzaak van op onderzoek gebaseerde benaderingen om de uitdagingen te overwinnen waarmee AI-modellen worden geconfronteerd bij het herkennen van afbeeldingen, vooral bij alledaagse taken zoals het aangeven van de tijd. Het valt nog te bezien hoe deze bevindingen de ontwikkeling van slimmere, meer contextbewuste systemen in de toekomst zullen beïnvloeden.