Il y a quelque chose de presque comique dans la situation. Pendant que les grands laboratoires américains rivalisent à coups d’annonces milliardaires, une équipe venue de Chine vient de mettre en ligne — gratuitement, sous licence MIT — un modèle de 1,6 trillion de paramètres qui talonne les meilleures références propriétaires. C’est DeepSeek V4-Pro, publié le 24 avril 2026.
Un colosse d’une efficacité surprenante
Sur le papier, 1,6 trillion de paramètres ça fait peur. En pratique, l’architecture Mixture-of-Experts (MoE) de V4-Pro n’en active que 49 milliards à chaque traitement — ce qui change tout en termes de coût d’inférence. L’architecture dite Hybrid Attention, combinant Compressed Sparse Attention et Heavily Compressed Attention, permet d’atteindre une fenêtre de contexte native d’un million de tokens tout en ne mobilisant que 27 % des FLOPs d’un token simple par rapport au modèle précédent V3.2. Dit autrement : un modèle plus grand, mais paradoxalement moins cher à faire tourner.
Les benchmarks confirment la performance. Sur SWE-bench Verified — le test qui mesure la capacité à résoudre des bugs logiciels réels — V4-Pro obtient 80,6 %. Claude Opus 4.6 est à environ 80,8 %. L’écart est, littéralement, de deux dixièmes de point. Pour un modèle open source disponible gratuitement.
MIT et Hugging Face : le pari de la transparence totale
DeepSeek a publié les poids sur Hugging Face sous licence MIT. Cela signifie que n’importe qui peut télécharger, modifier et déployer le modèle commercialement — sans restriction d’usage, sans clause de non-compétition, sans muraille. Le modèle est aussi accessible via l’API DeepSeek pour ceux qui préfèrent ne pas gérer l’infrastructure, mais la possibilité du déploiement local est entière.
Deux variantes sont disponibles : V4-Pro avec 1,6 trillion de paramètres totaux (49 milliards activés par token), et V4-Flash avec 284 milliards de paramètres (13 milliards activés). Même licence MIT, même approche MoE, pour des cas d’usage plus légers ou des contraintes matérielles plus strictes.
Ce que ça dit de la compétition ouverte
Le modèle de DeepSeek tourne à « un sixième du coût » des modèles comparables chez OpenAI ou Anthropic — selon les estimations rapportées par plusieurs analyses techniques. Ce n’est pas qu’une question de prix : c’est une démonstration que la course aux paramètres ne se gagne pas avec les budgets les plus lourds, et que l’optimisation architecturale peut combler des écarts considérables.
Pour les entreprises cherchant à déployer de l’IA en interne — sans dépendre d’un cloud américain, sans payer des API à la requête, sans céder leurs données — V4-Pro est désormais une option sérieuse. Pour les développeurs, avoir accès à des poids de cette qualité en open weights est une opportunité rare. L’open source n’est plus le parent pauvre des benchmarks.
Ce qui mérite réflexion
La licence MIT ne pose pas de contrainte sur qui utilise le modèle ni dans quel contexte. La souveraineté par l’open source, c’est réel — mais elle s’accompagne d’une vigilance nécessaire sur la provenance des données d’entraînement et les éventuels biais intégrés. DeepSeek reste une entreprise opérant sous juridiction chinoise. Ce n’est pas une raison de se priver d’un outil de cette valeur ; c’est une raison de l’adopter avec lucidité plutôt qu’avec naïveté.
La question que V4-Pro repose est plus fondamentale : à quoi servent les milliards investis dans des modèles fermés si des équipes concurrentes arrivent à des résultats quasi-identiques en open source, à une fraction du coût ? La réponse des Big Labs tient souvent à la sécurité, à la gouvernance, au service. L’argument s’érode à mesure que les alternatives s’améliorent. La balle est dans le camp des utilisateurs — et, désormais, le terrain de jeu est bien ouvert.
Sources
- DeepSeek Launches V4 Models with 1.6 Trillion Parameters — Phemex
- DeepSeek-V4-Pro — Hugging Face
- DeepSeek V4-Pro Review: Benchmarks, Pricing & Architecture — Build Fast with AI
- DeepSeek V4 Released: 1.6T Open-Source, 1M Context, MIT — ModemGuides
- Build with DeepSeek V4 Using NVIDIA Blackwell — NVIDIA Technical Blog

