Изследването на AI показва, че машините се разкъсват в тъмнината в тъмното!

Изследването на AI показва, че машините се разкъсват в тъмнината в тъмното!

Edinburgh, Vereinigtes Königreich - Съвременният изкуствен интелект (AI) постигна забележителен напредък, например в областта на текстовата позиция и програмирането. Ново проучване на Университета в Единбург обаче разкрива изненадваща слабост: тези системи очевидно не могат да четат аналогови часовници. Разследването, което скоро ще бъде публикувано през април, показва, че дори моделите на AI са грешни в повече от 75 % от случаите, когато стана дума за разпознаване на времето за аналогични циферблати. По-специално, часовници с римски цифри или без втора точка, в която проблемът често се крие в откриването на указателите и техните ъгли на циферблата, съобщава Google Gemini 2.0 и антроп Claude 3.5. Всеки модел се сблъсква със снимки с различни часовници. Моделите AI бяха попитани: "По кое време часовникът показва на снимката?" Резултатите показаха тревожна точност: Google Gemini 2.0 постигна най-доброто представяне в теста на часовника с 22.58 %, докато Openai GPT-1 в различен контекст-анализът на календарни изображения с 80 %правилни отговори, което също означава степен на грешка от 20 %, обяснява Gizmodo .

Слабости във времето възприемане на KI

Трудностите при интерпретирането на аналогови часовници илюстрират границите на AI моделите в ежедневните задачи, които интуитивно решават хората. Според Rohit Saxena, сътрудничество на изследването, тези дефицити спешно трябва да се справят, за да направят AI използваеми за критични приложения. Грешките възникват особено често в часовници със сложни дизайни, което илюстрира предизвикателствата, че разработчиците са пред подобрението на AI технологиите.

Интересно наблюдение на изследването е, че AI моделите нямат проблеми с анализа на календарните изображения в същата степен. Това може да показва различни механизми за обработка, които интегрират мултимедийна информация, което показва предимствата на мултимодалните AI модели, които взаимодействат чрез обработката на различни типове данни като текст, изображение и биометрия, както в bi4allconsulting

Мултимодален AI и техните предизвикателства

Мултимодалните модели се характеризират чрез комбиниране на различни източници на данни, за да се даде възможност за по -стабилно вземане на решение. Тези системи обаче се борят с предизвикателства, като дисбаланса на модалностите и необходимостта от големи количества данни с високо качество. Въпреки това, гъвкавостта на мултимодалното взаимодействие може също да бъде ключ към подобреното потребителско изживяване в многобройни области на приложение.

Проучването на Университета в Единбург подчертава необходимостта от подходи, базирани на изследвания, за преодоляване на предизвикателствата, с които AI моделите се сблъскват с разпознаването на изображения, особено в ежедневните задачи, като четене на времето. Остава да видим как тези открития ще повлияят на развитието на развитието на интелигентни, по -контекстни системи, които са в бъдеще.

Details
OrtEdinburgh, Vereinigtes Königreich
Quellen

Kommentare (0)