En avril 2026, les modèles d’origine chinoise — DeepSeek V4 Coder, Qwen3.6-Plus, GLM-5.1 de Z.ai — représentent 48 % de tout le trafic sur OpenRouter, contre moins de 2 % fin 2024. Les six premières places du classement mondial par tokens consommés sont chinoises. Une bascule vertigineuse.
Le prix, arme de conquête massive
Le facteur déterminant n’est pas (seulement) la qualité : c’est le prix, 10 à 20× inférieur à celui des modèles américains. À performance comparable sur de nombreux usages, le calcul est vite fait pour les développeurs et les entreprises qui consomment des milliards de tokens. La domination est autant tarifaire qu’algorithmique.
Une question de souveraineté mal posée
Cette bascule pose une question que l’Europe peine à articuler : déléguer son inférence IA à des modèles chinois, c’est accepter une dépendance sur les données traitées, les biais intégrés, et la disponibilité future. Le débat européen reste centré sur la régulation (AI Act) quand le terrain se joue sur le coût et la disponibilité.
Ce que ça change pour les entreprises
Pour les PME alsaciennes, l’écart de prix est une tentation réelle. Mais la vraie décision est stratégique : quelles données accepte-t-on de faire transiter par quel modèle ? Réserver les modèles low-cost aux tâches non sensibles, garder l’européen ou le local pour le critique : le routage intelligent devient une compétence clé, pas un détail technique.

