ArbeitRegierungTechnologieVerbraucherWelt

Die wahre Ursache für den DeepSeek-Hype laut KI-Experten

Chinas DeepSeek sorgt mit seinem bahnbrechenden R1 AI-Modell für Aufregung und könnte das Rennen um die KI-Dominanz nachhaltig verändern – ein echter Gamechanger!

Im vergangenen Monat sorgte DeepSeek für Furore in der Technologiebranche – und das aus gutem Grund, so Experten für künstliche Intelligenz. Sie sind überzeugt, dass wir wahrscheinlich erst am Anfang des Einflusses des chinesischen Tech-Startups auf das KI-Feld stehen.

DeepSeeks bahnbrechendes KI-Modell

DeepSeek machte Ende Januar Schlagzeilen mit seinem R1 KI-Modell, das laut der Firma in etwa die Leistung des OpenAI o1 Modells zu einem Bruchteil der Kosten erreichen kann. Technologieaktien sind gefallen, nachdem DeepSeek kurzzeitig ChatGPT verdrängte und zur meistgenutzten App im Apple App Store wurde.

Die Reaktion der US-Tech-Giganten

Dieser Erfolg brachte US-Technologiegiganten dazu, die Stellung Amerikas im Wettlauf um künstliche Intelligenz gegen China zu hinterfragen – und die Milliarden von Dollar, die hinter diesen Bemühungen stehen. Obwohl Vizepräsident JD Vance DeepSeek oder China in seiner Rede auf dem Artificial Intelligence Action Summit in Paris nicht namentlich erwähnte, betonte er, wie wichtig es für die Vereinigten Staaten sei, in diesem Sektor führend zu bleiben.

Kurze Werbeeinblendung

„Die Vereinigten Staaten von Amerika sind der Anführer im Bereich KI, und unsere Regierung plant, das so zu belassen“, sagte er, fügte jedoch hinzu, dass „Amerika bereit ist, mit anderen Ländern zusammenzuarbeiten“.

DeepSeek: Mehr als nur Effizienz

Es ist jedoch nicht nur die Effizienz und Leistung von DeepSeek. Die Art und Weise, wie DeepSeek R1 logisch denken und Antworten durchdenken kann, um qualitativ hochwertige Ergebnisse zu liefern, sowie die Entscheidung des Unternehmens, zentrale Teile seiner Technologie öffentlich zugänglich zu machen, werden das Feld laut Experten ebenfalls vorantreiben.

In den letzten zwei Jahren hat KI dank des Aufstiegs von ChatGPT und anderen generativen KI-Diensten, die die Art und Weise, wie Menschen arbeiten, kommunizieren und Informationen finden, revolutioniert haben, einen Höhepunkt erreicht. Unternehmen wie Nvidia haben sich zu Wall Street Lieblingen entwickelt und den Kursverlauf der Silicon Valley-Giganten durcheinandergebracht. Daher werden Entwicklungen, die helfen, leistungsfähigere und effizientere Modelle zu entwickeln, genau beobachtet.

Das kritische Echo der Branche

„Das ist definitiv kein Hype“, sagte Oren Etzioni, der ehemalige CEO des Allen Institute for Artificial Intelligence. „Das hier ist eine sehr schnelllebige Welt.“

DeepSeek und die Bedenken über Sicherheit

Die Reaktionen der Technologieführer auf den Aufstieg von DeepSeek waren schnell. Der CEO von Google DeepMind, Demis Hassabis, bezeichnete den Hype um DeepSeek als „übertrieben“, räumte aber ein, dass das Modell „wahrscheinlich die beste Arbeit ist, die ich aus China gesehen habe“, so CNBC.

Microsoft CEO Satya Nadella sagte während des Quartalsgewinnaufrufs des Unternehmens im Januar, dass DeepSeek einige „reale Innovationen“ bietet, während der CEO von Apple, Tim Cook, während des Gewinnaufrufs des iPhone-Herstellers betonte, dass „Innovation, die Effizienz fördert, etwas Positives ist“.

Doch die Aufmerksamkeit war nicht ausschließlich positiv. Der Halbleiterforscher SemiAnalysis äußerte Zweifel an DeepSeeks Behauptung, dass das Training nur 5,6 Millionen US-Dollar gekostet habe. OpenAI teilte The Financial Times mit, dass es Beweise gefunden hat, wonach DeepSeek die Modelle des US-Unternehmens verwendet hat, um einen eigenen Konkurrenten zu trainieren.

Regierungsanfragen und das TikTok-Phänomen

„Wir sind uns bewusst und prüfen Hinweise darauf, dass DeepSeek möglicherweise unangemessen unsere Modelle destilliert hat und werden Informationen mitteilen, sobald wir mehr wissen“, sagte ein OpenAI-Sprecher in einem Kommentar an CNN. DeepSeek war zunächst nicht für einen Kommentar zu erreichen.

Ein Paar US-Gesetzgeber forderte bereits, dass die App von Gerätschaften der Regierung verboten wird, nachdem Sicherheitsforscher auf ihre potenziellen Verbindungen zur chinesischen Regierung hingewiesen hatten, wie Associated Press und ABC News berichteten. Ähnliche Bedenken wurden hinsichtlich der beliebten Social-Media-App TikTok geäußert, die an einen amerikanischen Eigentümer verkauft oder in den USA verboten werden muss.

„DeepSeek ist das TikTok der (großen Sprachmodelle)“, so Etzioni.

Der nachhaltige Einfluss von DeepSeek auf die Technologiebranche

Technologieriesen denken bereits darüber nach, wie die Technologie von DeepSeek ihre Produkte und Dienstleistungen beeinflussen kann. „Was DeepSeek uns gegeben hat, war im Wesentlichen das Rezept in Form eines technischen Berichts, aber sie haben uns nicht die fehlenden Teile geliefert“, sagte Lewis Tunstall, Senior Research Scientist bei Hugging Face, einer KI-Plattform, die Entwicklertools anbietet.

Tunstall leitet eine Initiative bei Hugging Face, um DeepSeeks R1-Modell vollständig Open Source zu machen; während DeepSeek ein Forschungspapier und die Parameter des Modells bereitgestellt hat, wurden der Code und die Trainingsdaten nicht offengelegt.

Die Zukunft der KI-Modelle

Nadella erwähnte während des Gewinnaufrufs von Microsoft, dass Windows Copilot+ PCs, die spezifisch für die Unterstützung von KI-Modellen konzipiert sind, in der Lage sein werden, KI-Modelle, die aus DeepSeek R1 destilliert wurden, lokal auszuführen. Der mobile Chiphersteller Qualcomm gab am Dienstag bekannt, dass innerhalb einer Woche Modelle, die aus DeepSeek R1 destilliert wurden, auf Smartphones und PCs, die mit seinen Chips betrieben werden, liefen.

KIT-Forscher, Akademiker und Entwickler erkunden weiterhin, was DeepSeek für den Fortschritt der KI bedeutet.

DeepSeeks Modell ist nicht das einzige Open-Source-Modell, noch ist es das erste, das in der Lage ist, über Antworten nachzudenken, bevor eine Antwort gegeben wird; auch OpenAIs o1-Modell aus dem letzten Jahr kann dies. Was DeepSeek jedoch bedeutsam macht, ist die Fähigkeit, logisch zu denken und von anderen Modellen zu lernen, sowie die Transparenz, die der KI-Community gewährt wird, um zu sehen, was im Hintergrund geschieht. Die Nutzer des R1 Modells in der DeepSeek-App können auch den „Denkprozess“ des Modells beobachten, wenn Fragen beantwortet werden.

„Man kann sehen, wie die Räder im Inneren der Maschine drehen“, sagte Durga Malladi, Senior Vice President und General Manager für Technologieplanung und Edge-Lösungen bei Qualcomm, gegenüber CNN.

Tunstall ist der Meinung, dass wir in nicht allzu ferner Zukunft eine Welle neuer Modelle sehen werden, die in der Lage sind, wie DeepSeek zu denken. Das könnte entscheidend sein, da Technologiegiganten darauf drängen, KI-Agents zu entwickeln, die Silicon Valley grundsätzlich als die nächste Evolution des Chatbots ansehen und wie Verbraucher mit Geräten interagieren – obwohl dieser Wandel bisher noch nicht vollzogen ist.

Grok 3, die nächste Iteration des Chatbots auf der Social-Media-Plattform X, wird „sehr leistungsstarke Denkfähigkeiten“ haben, sagte sein Besitzer, Elon Musk, am Donnerstag in einem Videoauftritt während des Weltregierungs-Gipfels.

Im Moment wird die KI-Community weiterhin mit dem experimentieren, was DeepSeek zu bieten hat. Bis der nächste Durchbruch erreicht ist.

„Ich sage voraus, dass es in den nächsten 12 Monaten durch etwas anderes ersetzt wird“, sagte Etzioni. „Aber es ist ein sehr echter Fortschritt.“


Details zur Meldung
Quelle
edition.cnn.com

Ähnliche Artikel

Schaltfläche "Zurück zum Anfang"