On a testé Fable 5, GPT-5.5 et Gemini 3.1 Pro sur 4 épreuves : qui gagne ?
Même prompt, trois modèles phares, du code réel et un chrono. Première manche de notre benchmark : créer une simulation de ruche d’abeilles en un seul fichier HTML. Les écarts sont vertigineux.
