Les agents IA de recherche confirment leurs connaissances au lieu d'investiguer
Les modèles GPT-5.4 et Kimi K2.6 utilisent principalement le web pour valider leurs données d'entraînement plutôt que pour explorer vraiment, selon des chercheurs de l'Institut Harbin
Publié 5h·1 média·Important
≈ 34s
📋 Le fait
Un nouveau benchmark temporel (LiveBrowseComp) testant uniquement des événements des 90 derniers jours révèle l'effondrement des performances quand les modèles ne peuvent pas s'appuyer sur leur mémoire
Les classements existants des agents IA sont remis en question : sans accès à l'entraînement, leurs capacités de recherche réelle restent limitées
Salesforce affirme avoir réduit une migration de 231 jours à 13 jours avec Claude
🟢 5h· 1 source
ActifImportant
Salesforce a migré son environnement de développement vers Claude Code (Anthropic) sans limites de tokens, rapportant 79% plus de pull requests par développeur et 5% moins d'incidents.
Lire la suiteReplier▾
Salesforce a migré son environnement de développement vers Claude Code (Anthropic) sans limites de tokens, rapportant 79% plus de pull requests par développeur et 5% moins d'incidents.
La migration aurait été réduite de 231 jours à 13 jours, mettant en avant les gains de productivité des agents IA autonomes.