La verdadera causa de la exageración de Deepseek según los expertos en IA

La verdadera causa de la exageración de Deepseek según los expertos en IA

El mes pasado Deepseek causó una sensación en la industria de la tecnología, y por una buena razón, según expertos en inteligencia artificial. Estás convencido de que probablemente solo estaremos en el campo AI al comienzo de la influencia de la startup de tecnología china.

Deepseek's innovador modelo de IA

A finales de enero,

Deepseek fue noticia con su modelo R1 AI, que según la compañía puede lograr aproximadamente el rendimiento del modelo OpenAI O1 a una fracción de los costos. La tecnología comparte cayeron después de que Deepseek Chatgpt salió y para la aplicación más utilizada en Apple App Store fue.

La reacción de los gigantes tecnológicos de EE. UU.

Este éxito hizo que los géneros tecnológicos estadounidenses cuestionen la posición de Estados Unidos en la carrera por la inteligencia artificial contra China y los miles de millones de dólares detrás de estos esfuerzos. Aunque el vicepresidente JD Vance Deepseek o China en su discurso Paris No mencionado por el nombre, él enfatizó que era importante para que se produzca el estado de los Estados Unidos.

"Estados Unidos es el líder en el área de IA, y nuestro gobierno planea dejarlo", dijo, pero agregó que "Estados Unidos está listo para trabajar con otros países".

Deepseek: más que solo eficiencia

Sin embargo, no es solo la eficiencia y el rendimiento de Deepseek. Según los expertos En los últimos dos años, KI ha alcanzado un punto destacado gracias al ascenso de Chatt y otros servicios generativos de IA que han revolucionado la forma en que las personas trabajan, se comunican y encuentran información. Empresas como nvidia dedicado y confundido del silicon. Por lo tanto, los desarrollos que ayudan a desarrollar modelos más potentes y eficientes se observan de cerca.

El eco crítico de la industria

"Esto definitivamente no es un bombo", dijo Oren Etzioni, ex CEO de todos los Institutos para la Inteligencia Artificial. "Este es un mundo de movimiento muy rápido".

Deepseek y las preocupaciones sobre la seguridad

Las reacciones de los líderes de la tecnología al ascenso de Deepseek fueron rápidas. El CEO de Google Deepmind, Demis Hassabis, describió la exageración en torno a Deepseek como "exagerado", pero admitió que el modelo "es probablemente el mejor trabajo que vi de China", por lo que cnbc .

El CEO de Microsoft, Satya Nadella, dijo durante la llamada de la compañía al trimestre que Deepseek ofrece algunas "innovaciones reales", mientras que el CEO de Apple, Tim Cook, enfatizó durante la llamada ganadora del fabricante de iPhone que "innovación, que promueve la eficiencia, es algo positivo".

Pero la atención no solo fue positiva. El investigador de semiconductores semianálisis Expresó dudas sobre el reclamo de Deepseek que el entrenamiento solo costó 5.6 millones de dólares. OpenAai dividió The Financial Times Deepseek usó los modelos de la compañía estadounidense para entrenar su propia competencia.

Consultas gubernamentales y el fenómeno de Tikok

"Somos conscientes y verificamos que Deepseek pueda haber destilado nuestros modelos de manera inapropiada y proporcionará información tan pronto como sepamos más", dijo un portavoz de OpenAI en un comentario a CNN. Deepseek inicialmente no estaba disponible para un comentario.

Algunos legisladores estadounidenses ya han llamado que la aplicación del Gobierno del Gobierno cnn.com/2025/06/tech/deepseek-aus-ban-bill/index.html> Connections to the gobierno chino había señalado, tal como Associated Press y ABC News . "https://www.cnn.com/2025/01/tech/tektok-ban/index.html"> tiktok que se venden a un propietario estadounidense o se prohiben en los EE. UU.

"Deepseek es el tikok de (modelos de idiomas grandes)", dice Etzioni.

La influencia sostenible de Deepseek en la industria de la tecnología

Los gigantes de la tecnología ya piensan en cómo la tecnología Deepseek puede influir en sus productos y servicios. "Lo que Deepseek nos dio fue esencialmente la receta en forma de un informe técnico, pero no entregaron las partes faltantes", dijo Lewis Tunstall, científico de investigación senior de Hugging Face, una plataforma de IA que ofrece herramientas de desarrolladores.

Tunstall lidera una iniciativa en Hugging Face para hacer que el modelo R1 de Deepseek sea completamente abierto; Si bien Deepseek ha proporcionado un trabajo de investigación y el parámetro del modelo, el código y los datos de capacitación no fueron revelados.

El futuro de los modelos AI

Durante la llamada ganadora de Microsoft,

Nadella mencionó que Windows Copilot+ PCS, que están específicamente diseñados para el soporte de modelos AI, podrán llevar a cabo modelos AI que fueron destilados por Deepseek R1. El fabricante de chips móviles Qualcomm anunció el martes que los modelos que se destilaron de Deepseek R1 a teléfonos inteligentes y PC que se operan con sus chips dentro de una semana.

Los investigadores, académicos y desarrolladores del kit continúan explorando qué significa Deepseek para el progreso de la IA.

El modelo de

Deepseek no es el único modelo de código abierto, ni es el primero en poder pensar en las respuestas antes de dar una respuesta; El modelo OpenAis O1 del año pasado también puede hacer esto. Sin embargo, lo que hace que Deepseek sea significativo es la capacidad de pensar lógicamente y aprender de otros modelos, así como la transparencia otorgada a la comunidad de IA para ver lo que está sucediendo en el fondo. Los usuarios del modelo R1 en la aplicación Deepseek también pueden observar el "proceso de pensamiento" del modelo si se responden preguntas.

"Puede ver cómo las bicicletas dentro de la máquina", dijo a CNN Durga Malladi, vicepresidenta senior y gerente general de planificación tecnológica y soluciones de borde en Qualcomm.

Tunstall cree que en un futuro no muy lejano veremos una ola de nuevos modelos que puedan pensar como Deepseek. Esto podría ser crucial para instar a la tecnología a desarrollar agentes de KI que Silicon Valley básicamente vea la próxima evolución del chatbot y cómo los consumidores interactúan con dispositivos, aunque este cambio aún no se ha llevado a cabo.

Grok 3, la próxima iteración del chatbot en la plataforma de redes sociales X, tendrá "habilidades de pensamiento muy poderosas", dijo su dueño, Elon Musk, el jueves en una aparición en un video durante la Cumbre Mundial de Regulación.

En este momento, la comunidad de IA continúa experimentando con lo que Deepseek tiene para ofrecer. Hasta que se logre el próximo avance.

"Predigo que será reemplazado por algo más en los próximos 12 meses", dijo Etzioni. "Pero es un progreso muy real".

Kommentare (0)