Az AI -tanulmány azt mutatja, hogy a gépek sötétben belemerülnek a sötétben!

Az AI -tanulmány azt mutatja, hogy a gépek sötétben belemerülnek a sötétben!

Edinburgh, Vereinigtes Königreich - A modern mesterséges intelligencia (AI) figyelemre méltó előrelépést tett, például a szöveges helyzet és a programozás területén. Az Edinburgh -i Egyetem új tanulmánya azonban meglepő gyengeséget mutat: ezek a rendszerek nyilvánvalóan nem tudják elolvasni az analóg órákat. A vizsgálat, amelyet hamarosan áprilisban tesznek közzé, azt mutatja, hogy még a fejlett AI -modellek is tévesek voltak az esetek több mint 75 % -ában, amikor az analóg tárcsák idejét felismerték. Különösen a római számjegyekkel rendelkező órák vagy egy második pont nélkül, amelyben a probléma gyakran a mutatók és a dialagok szögeinek észlelésében rejlik A vizsgálatban összesen hét AI modellt teszteltünk, beleértve az OpenAai GPT-4-et, a Google Gemini 2.0-t és az Antropic Claude 3.5-et. Mindegyik modellt különböző órás stílusú képekkel szembesülnek. Az AI modelleket megkérdezték: "Mennyire jelenik meg az óra a képen?" Az eredmények aggasztó pontosságot mutattak: a Google Gemini 2.0 a legjobb teljesítményt az óratesztben 22,58 %-kal érte el, míg az Openai GPT-1 eltérő kontextusban-a naptár képeinek elemzése 80 %-os helyes válaszokkal, ami szintén 20 %-os hibaarányt jelent, magyarázza gizmodo .

gyengeségek a Ki

idő észlelésében

Az analóg órák értelmezésének nehézségei szemléltetik az AI modellek határait a mindennapi feladatokban, amelyek intuitív módon oldják meg az embereket. Rohit Saxena, a tanulmány társszerzője szerint ezeket a hiányokat sürgősen meg kell küzdeni annak érdekében, hogy az AI -t használhatóvá tegyék az időkritikus alkalmazásokhoz. A hibák különösen gyakran fordultak elő a bonyolult tervekkel rendelkező órákban, amelyek szemléltetik azokat a kihívásokat, amelyeket a fejlesztők az AI technológiák fejlesztése előtt állnak.

A tanulmány érdekes megfigyelése az, hogy az AI modellek nem voltak problémák a naptárképek elemzésével ugyanolyan mértékben. Ez jelezheti a multimédiás információkat integráló különféle feldolgozási mechanizmusokat, amelyek jelzik a multimodális AI modellek előnyeit, amelyek kölcsönhatásba lépnek a különféle adattípusok, például a szöveg, a kép és a biometria feldolgozása révén, mint a

Az Edinburgh-i Egyetem tanulmánya hangsúlyozza a kutatáson alapuló megközelítések szükségességét, hogy legyőzzék azokat a kihívásokat, amelyekkel az AI modellek szembesülnek a képek elismerésével, különösen a mindennapi feladatokban, például az idő elolvasása. Még nem kell látni, hogy ezek az eredmények hogyan befolyásolják a jövőben az intelligens, kontextus tudattalan rendszerek fejlődésének fejlődését.

Details
OrtEdinburgh, Vereinigtes Königreich
Quellen

Kommentare (0)