Štúdia AI ukazuje, že stroje sa roztrhávajú v tme v tme!
Štúdia AI ukazuje, že stroje sa roztrhávajú v tme v tme!
Edinburgh, Vereinigtes Königreich - Moderná umelá inteligencia (AI) dosiahla pozoruhodný pokrok, napríklad v oblasti textovej pozície a programovania. Nová štúdia University of Edinburgh však odhaľuje prekvapujúcu slabosť: tieto systémy zjavne nedokážu čítať analógové hodinky. Vyšetrovanie, ktoré bude čoskoro uverejnené v apríli, ukazuje, že aj modely AI AI sa mýlili vo viac ako 75 % prípadov, pokiaľ ide o rozpoznávanie času na analogických číselníkoch. Najmä hodinky s rímskymi číslicami alebo bez druhého bodu, v ktorom problém často spočíva v detekcii ukazovateľov a ich uhlov na číselníku, píše Google Gemini 2.0 a Anthropic Claude 3.5. Každý model bol konfrontovaný s obrázkami rôznych hodín. Modely AI sa opýtali: „Koľko hodín sa hodinky zobrazujú na obrázku?“ Výsledky ukázali znepokojujúcu presnosť: Google Gemini 2.0 dosiahol najlepší výkon v teste hodín s 22,58 %, zatiaľ čo OpenAi GPT-1 v inej kontexte-analýza kalendárnych obrazov s 80 %správnymi odpoveďami, čo tiež znamená chybovosť 20 %, vysvetľuje
Multimodálne modely sa vyznačujú kombináciou rôznych zdrojov údajov, aby sa umožnilo robustnejšie rozhodovanie. Tieto systémy však bojujú s výzvami, ako je nerovnováha modalitov a potreba veľkého množstva vysokých kvalitných údajov. Flexibilita multimodálnej interakcie by však mohla byť tiež kľúčom k zlepšeniu skúseností používateľa v mnohých oblastiach aplikácií. Štúdia University of Edinburgh zdôrazňuje potrebu výskumných prístupov na prekonanie problémov, s ktorými sú modely AI konfrontované s uznaním obrazov, najmä pri každodenných úlohách, ako je napríklad čítanie času. Zostáva vidieť, ako tieto zistenia v budúcnosti ovplyvnia rozvoj rozvoja inteligentných systémov s vedomím kontextu. Multimodálna AI a ich výzvy
Details | |
---|---|
Ort | Edinburgh, Vereinigtes Königreich |
Quellen |