DeepSeek : la révolution chinoise de l'intelligence artificielle

Depuis quelques jours, DeepSeek est au centre de l'attention mondiale. Le laboratoire chinois d'intelligence artificielle a fait sensation en propulsant son application chatbot au sommet du classement de l'App Store d'Apple. Ses modèles d'IA, conçus avec des techniques d'optimisation des ressources de calcul, remettent en question la suprématie américaine dans la course à l'IA et suscitent des doutes quant à la durabilité de la demande en puces IA.

2025-01-29Comment

Mais comment DeepSeek a-t-il fait une percée aussi rapide sur la scène internationale ?

Les origines de DeepSeek : une approche issue du trading

DeepSeek est financé par High-Flyer Capital Management, un fonds de couverture quantitatif chinois qui utilise l'intelligence artificielle pour optimiser ses stratégies de trading. Son fondateur, Liang Wenfeng, passionné d'IA, a d'abord expérimenté le trading pendant ses études à l'université de Zhejiang avant de créer High-Flyer Capital Management en 2019.

En 2023, ce fonds a décidé de séparer ses activités financières de sa recherche en intelligence artificielle en fondant DeepSeek en tant que laboratoire indépendant. Dès le départ, DeepSeek a construit ses propres centres de données pour entraîner ses modèles, mais il a dû composer avec les restrictions américaines sur l'exportation de matériel. Contraint d'utiliser des puces Nvidia H800, moins puissantes que les H100 disponibles pour les entreprises américaines, DeepSeek a dû redoubler d'efficacité pour rivaliser avec ses homologues occidentaux.

L'entreprise s'appuie sur une équipe technique jeune et recrute activement des chercheurs en IA issus des meilleures universités chinoises. De manière surprenante, elle embauche également des personnes sans formation en informatique afin d'enrichir ses modèles avec une meilleure compréhension des sujets variés.

Des modèles d'IA performants et disruptifs

DeepSeek a dévoilé ses premiers modèles en novembre 2023 : DeepSeek Coder, DeepSeek LLM et DeepSeek Chat. Mais c'est au printemps 2024, avec la sortie de DeepSeek-V2, que l'industrie a commencé à prendre le laboratoire au sérieux. Son modèle d'analyse de texte et d'images s'est imposé comme une alternative puissante et beaucoup plus économique que ses concurrents, forçant des mastodontes comme ByteDance et Alibaba à réduire leurs prix, voire à rendre certains services gratuits.

Avec la sortie de DeepSeek-V3 en décembre 2024, la popularité de l'entreprise a explosé. Selon ses propres benchmarks, ce modèle surpasserait aussi bien les modèles open-source comme Llama de Meta que les modèles fermés comme GPT-4o d'OpenAI. Mais le véritable atout de DeepSeek réside dans R1, son modèle de "raisonnement" sorti en janvier 2025. R1 se distingue par sa capacité à vérifier ses propres réponses, réduisant ainsi les erreurs fréquentes des IA traditionnelles. Bien qu'il soit plus lent à produire des résultats, il s'avère plus fiable pour les disciplines exigeant une logique rigoureuse, comme les mathématiques et les sciences.

Cependant, DeepSeek doit composer avec la réglementation chinoise. Comme toutes les entreprises technologiques du pays, elle est soumise à un contrôle strict du gouvernement, ce qui impacte la manière dont ses modèles répondent à certaines questions sensibles.

Une stratégie de rupture qui inquiète la concurrence

DeepSeek adopte une approche commerciale agressive en proposant ses modèles à des prix très inférieurs à ceux du marché, voire gratuitement. L'entreprise affirme que ses percées en matière d'efficacité lui permettent de maintenir cette compétitivité extrême, bien que certains experts restent sceptiques quant à la viabilité à long terme de ce modèle économique.

Quoi qu'il en soit, l'adoption massive de ses modèles est indéniable. Sur la plateforme Hugging Face, plus de 500 variantes de R1 ont été créées par la communauté des développeurs, accumulant 2,5 millions de téléchargements.

L'impact de DeepSeek se fait déjà ressentir sur le marché : la récente baisse de 18 % du cours de l'action Nvidia a été attribuée, en partie, à la montée en puissance de DeepSeek. Même Sam Altman, PDG d'OpenAI, a publiquement réagi à l'émergence de cette nouvelle concurrence.

Un avenir incertain, mais prometteur

L'avenir de DeepSeek reste flou. L'entreprise continuera sans aucun doute à améliorer ses modèles, mais elle devra aussi faire face à des tensions géopolitiques croissantes. Les États-Unis surveillent de près l'influence des entreprises chinoises en IA et pourraient prendre des mesures pour restreindre encore davantage leur accès aux technologies occidentales.

DeepSeek représente-t-il une véritable révolution dans la course à l'IA ? Son modèle d'innovation rapide et son approche open-source en font un acteur à surveiller de près. Une chose est certaine : la compétition mondiale en intelligence artificielle ne fait que s'intensifier.