Nature : les scientifiques humains écrasent les meilleurs agents IA sur les tâches complexes
Une étude publiée dans Nature montre que les meilleurs agents IA — GPT, Claude, Gemini — obtiennent environ la moitié des scores des docteurs humains sur des tâches scientifiques complexes multi-étapes. Malgré l’engouement généralisé, les agents autonomes restent loin des experts humains sur les travaux de recherche réels.
