DeepSeek, ein relativ unbekanntes chinesisches KI-Startup, sorgte mit seinem neuesten KI-Modell DeepSeek-V3 auf dem Markt für Aufsehen.
Der KI-Assistent von DeepSeek schoss am Montag auf Platz 1 der am häufigsten heruntergeladenen Apps. Einige Beobachter der US-Technologiebranche befürchten, dass das chinesische Startup im Bereich generativer KI zu führenden amerikanischen Unternehmen aufgeschlossen hat.
Dieses Modell wurde ursprünglich gegen Ende 2024 auf den Markt gebracht und hat Fähigkeiten gezeigt, die mit denen führender amerikanischer KI-Modelle mithalten können. Es kostete jedoch nur einen Bruchteil der Kosten und der Rechenleistung.
Die Entwicklung des Modells gilt als bedeutender Meilenstein und zeigt Chinas Fortschritte in der KI trotz strenger US-Exportkontrollen für Hochleistungs-Computerchips. DeepSeek-V3 wurde mit etwa 1 GPU-Chips trainiert und kostete rund 2,000 Millionen US-Dollar. Dies steht im krassen Gegensatz zu den Kosten ähnlicher US-Modelle, die Hunderte Millionen oder sogar Milliarden betragen können.
Aber es ist nicht nur die kostengünstige Ausbildung, die Aufmerksamkeit erregt.
Das Unternehmen hat Reinforcement Learning eingesetzt, um die Leistung des Modells zu verbessern, insbesondere im Hinblick auf die Denkfähigkeiten. Diese Methode reduziert die Abhängigkeit vom traditionellen überwachten Lernen und ermöglicht eine kosteneffizientere und skalierbarere KI-Entwicklung.
Die Ankündigung von DeepSeek-V3 hatte unmittelbare Auswirkungen auf den Aktienmarkt und betraf insbesondere Technologiewerte.
Chip Riese Nvidia Corp (NASDAQ:NVDA) verzeichnete am 600. Januar 27 einen historischen Rückgang des Marktwertes um fast 2025 Milliarden US-Dollar. Ausgelöst wurde dieser Rückgang durch die Sorgen der Anleger über die zukünftige Nachfrage nach High-End-KI-Chips, wenn Modelle wie DeepSeek mit weniger Mitteln ähnliche Ergebnisse erzielen könnten.
Mehr lesen: Gigantisches KI-Projekt „Stargate“ wird die Krebsbehandlung revolutionieren, behauptet Ellison
Rechenzentren werden bis 2026 so viel Strom verbrauchen wie Japan
Der Welleneffekt überrollte sogar peripher verwandte Aktien wie kanadische Uran-Emissionen wie Denison-Minen (TSE: DML)(NYSEAMERICAN: DNN)(FRA: IUQ), Cameco Corporation (TSE: CCO) (NYSE: CCJ), die alle im Zusammenhang mit dem chinesischen KI-Chatbot zweistellige Rückgänge hinnehmen mussten.
Die Internationale Energieagentur prognostiziert, dass Rechenzentren bis 2026 so viel Strom verbrauchen werden wie Japan. Das ist mehr als das Doppelte ihres derzeitigen Bedarfs. Darüber hinaus sehen Analysten Cameco als eines der kanadischen Unternehmen, die von einem KI-getriebenen Stromboom profitieren werden.
Darüber hinaus sind die Aktien des kanadischen Versorgungsunternehmens TransAlta Corporation (TSE: TA) stürzte während der Handelssitzung am Montag um bis zu 22 Prozent ab. Das in Calgary ansässige Unternehmen gab bekannt, dass es mit „mehreren Hyperscalern“ über die Entwicklung von Rechenzentren in Alberta verhandelt.
Darüber hinaus waren Aktien aus dem Bereich der erneuerbaren Energien, insbesondere solche, die mit der Infrastruktur für Rechenzentren verbunden sind, einem erheblichen Druck ausgesetzt. Unternehmen wie Brookfield Renewable Partner (NYSE: BEP) und Algonquin Power & Utilities (TSE: AQN) (NYSE: AQN) verzeichnete leichte Rückgänge, wahrscheinlich aufgrund von Bedenken darüber, wie sich der globale Energiebedarf durch Chinas Fortschritte im Bereich der künstlichen Intelligenz verändern könnte.
Auf dem Kryptowährungsmarkt gab es zunächst einen starken Anstieg von Token im Zusammenhang mit KI und Datenverarbeitung, da Spekulanten auf ein erhöhtes Interesse an KI-bezogenen Blockchain-Lösungen setzten.
Darüber hinaus erlebten wichtige Kryptowährungen wie Bitcoin und Ethereum leichte Rückgänge, da Händler die globale Nachfrage nach energieintensiven Bergbaubetrieben neu bewerteten.
Mehr lesen: Französisches Juwel Mistral AI gibt in Davos Pläne für Börsengang bekannt
Mehr lesen: Studie zeigt: Top-KI-Bots können nicht darauf vertrauen, dass sie genaue historische Informationen liefern
Die Preisstrategie von DeepSeek hat zu einer Disruption der KI-Technologie geführt
Allerdings sind nicht alle der Meinung, dass diese Entwicklung den Hype wert ist, den sie ausgelöst hat.
„Die Modelle, die sie gebaut haben, sind fantastisch, aber sie sind auch keine Wunder“, sagte Bernstein-Analystin Stacy Rasgon.
„Sie verwenden keine Innovationen, die unbekannt oder geheim sind oder so etwas. Das sind Dinge, mit denen jeder experimentiert.“
Das kleine Hangzhou-Startup hinter DeepSeek ging ursprünglich 2023 aus einem Hedgefonds hervor. Derzeit konzentriert es sich hauptsächlich auf die Entwicklung von Open-Source-KI-Modellen, ansonsten ist jedoch wenig über das Unternehmen bekannt.
Einige Analysten stellen DeepSeeks Behauptung in Frage, dass die Entwicklung und Schulung der Technologie weniger als 6 Millionen US-Dollar gekostet hätten, und argumentieren, dass diese Zahl wahrscheinlich nur die Rechenleistung berücksichtige. Sheldon Fernandez, Gründer von Darwin AI, wies jedoch darauf hin, dass DeepSeek selbst bei einer Verdreifachung der geschätzten Kosten immer noch deutlich billiger als seine Konkurrenten wäre.
DeepSeek hat am 1. Januar sein Open-Source-Modell DeepSeek-R20 veröffentlicht, das auf DeepSeek-V3 basiert. Mit dieser Version können Entwickler und Forscher die Funktionsweise des Modells untersuchen. Außerdem können sie es auf ihrer eigenen Infrastruktur ausführen und darauf aufbauen. Die Trainingsdaten sind jedoch weiterhin nicht verfügbar.
Fernandez erklärte, dass dieser Ansatz die Geschäftsmodelle der Konkurrenz stört. Diese basieren in der Regel darauf, den Unternehmen monatliche Gebühren für den Zugriff auf erweiterte KI-Funktionen zu berechnen.
Ungeachtet dessen hat DeepSeeks aggressive Preisstrategie große chinesische Technologieunternehmen wie Baidu, Alibaba und Tencent dazu gezwungen, die Preise für ihre KI-Modelle zu senken. Dies hat einen Preiskrieg auf dem chinesischen KI-Markt ausgelöst. Die Auswirkungen dieses Krieges haben KI-Dienste zugänglicher gemacht und gleichzeitig die Gewinnmargen unter Druck gesetzt.
Mehr lesen: Studie zeigt: Top-KI-Bots können nicht darauf vertrauen, dass sie genaue historische Informationen liefern
DeepThink ist der „Sputnik-Moment“ der KI
DeepSeek macht Schlagzeilen, weil es trotz der Bemühungen der USA, die Vorherrschaft in der KI-Entwicklung aufrechtzuerhalten, fortschrittliche KI entwickelt hat. Im Jahr 2022 beschränkten die USA den Export von Computerchips nach China und behinderten damit den Fortschritt des Unternehmens im Bereich des fortschrittlichen Supercomputings.
Dem Entwicklungspapier zufolge trainierten die Forscher das DeepSeek-V3-Modell mit Nvidias H800-Chips. Diese Chips wurden ursprünglich als Produkte mit reduzierter Leistungsfähigkeit entwickelt, um die US-Verkaufsbeschränkungen nach China zu umgehen. Später wurden sie aufgrund neuer US-Sanktionen verboten.
Viele sehen die neuesten KI-Modelle von DeepSeek als konkurrenzfähig zu denen von OpenAI und Meta-Plattformen (NASDAQ: META), die auf High-End-Chips und enorme Rechenleistung angewiesen sind.
Der Risikokapitalgeber aus dem Silicon Valley, Marc Andreessen, bezeichnete DeepSeeks R1-Modell in einem Beitrag auf X on Sunday als den „Sputnik-Moment“ der künstlichen Intelligenz. Er verglich es mit dem Start des Satelliten Sputnik durch die Sowjetunion, der Ende der 1950er Jahre das Weltraumrennen mit den USA auslöste.
DeepSeek unterscheidet sich von Konkurrenten wie OpenAI dadurch, dass seine Modelle „Open Source“ sind und jeder auf die Schlüsselkomponenten zugreifen und diese ändern kann. Allerdings hat das Unternehmen die für das Training verwendeten Daten nicht preisgegeben.
„Gefällt mir“ bei Mugglehead auf Facebook