توضح دراسة الذكاء الاصطناعي أن الآلات مزقة في الظلام في الظلام!

توضح دراسة الذكاء الاصطناعي أن الآلات مزقة في الظلام في الظلام!

Edinburgh, Vereinigtes Königreich - أحرز الذكاء الاصطناعي الحديث (AI) تقدمًا ملحوظًا ، على سبيل المثال في مجالات وضع النص والبرمجة. ومع ذلك ، فإن دراسة جديدة أجرتها جامعة أدنبرة تكشف عن ضعف مفاجئ: يبدو أن هذه الأنظمة لا يمكنها قراءة الساعات التناظرية. يُظهر التحقيق ، الذي سيتم نشره قريبًا في أبريل ، أنه حتى نماذج الذكاء الاصطناعى المتقدمة كانت خاطئة في أكثر من 75 ٪ من الحالات عندما يتعلق الأمر بالوقت على الأوجه المماثلة. على وجه الخصوص ، الساعات ذات الأرقام الرومانية أو بدون نقطة ثانية تكمن فيها المشكلة غالبًا في اكتشاف المؤشرات وزواياها على الاتصال الهاتفي ، تقارير Google Gemini 2.0 و Claude 3.5. واجه كل طراز صورًا من أشكال العمل المختلفة. سئل نماذج الذكاء الاصطناعى: "في أي وقت تظهر الساعة في الصورة؟" أظهرت النتائج دقة مقلقة: لقد حقق Google Gemini 2.0 أفضل أداء في اختبار الساعة بنسبة 22.58 ٪ ، في حين أن Openai GPT-1 في سياق مختلف-يشرح تحليل الصور التقويمية مع 80 ٪ من الإجابات الصحيحة ، مما يعني أيضًا معدل خطأ 20 ٪ ، gizmodo .

نقاط الضعف في تصور الوقت لـ Ki

توضح صعوبات تفسير الساعات التناظرية حدود نماذج الذكاء الاصطناعى في المهام اليومية التي تحل الناس بشكل حدسي. وفقًا لـ Rohit Saxena ، المؤلف المشترك للدراسة ، يجب معالجة هذه العجز بشكل عاجل من أجل جعل منظمة العفو الدولية قابلة للاستخدام في تطبيقات الوقت. حدثت الأخطاء في كثير من الأحيان في الساعات ذات التصميمات المعقدة ، والتي توضح التحديات التي يواجهها المطورون أمام التحسن في تقنيات الذكاء الاصطناعي.

ملاحظة مثيرة للاهتمام للدراسة هي أن نماذج الذكاء الاصطناعى ليست لديها مشاكل في تحليل الصور التقويمية بنفس القدر. يمكن أن يشير هذا إلى آليات معالجة مختلفة تدمج معلومات الوسائط المتعددة ، والتي تشير إلى مزايا نماذج الذكاء الاصطناعى متعددة الوسائط ، والتي تتفاعل من خلال معالجة أنواع البيانات المختلفة مثل النص والصورة والقياس الحيوي ، كما في bi4allconsulting

AI متعددة الوسائط وتحدياتهم

تتميز النماذج المتعددة الوسائط من خلال الجمع بين مصادر البيانات المختلفة لتمكين اتخاذ القرار الأكثر قوة. ومع ذلك ، فإن هذه الأنظمة تقاتل مع التحديات ، مثل اختلال التوازن في الطرائق والحاجة إلى كميات كبيرة من البيانات عالية الجودة. ومع ذلك ، يمكن أن تكون مرونة التفاعل متعدد الوسائط مفتاحًا لتجربة مستخدم محسّنة في العديد من مجالات التطبيق.

تؤكد الدراسة التي أجرتها جامعة إدنبرة على الحاجة إلى النهج القائمة على البحث للتغلب على التحديات التي تواجه بها نماذج الذكاء الاصطناعى الاعتراف بالصور ، وخاصة في المهام اليومية مثل قراءة الوقت. يبقى أن نرى كيف ستؤثر هذه النتائج على تطور أنظمة ذكية أكثر وعيًا في المستقبل.

Details
OrtEdinburgh, Vereinigtes Königreich
Quellen

Kommentare (0)