OpenAI : l'entraînement à des traits bénéfiques renforce la sécurité des modèles IA
OpenAI démontre que le renforcement d'apprentissage sur des traits comportementaux désirés (véracité, corrigibilité) améliore la sécurité des modèles IA à travers plusieurs domaines.
Publié 3h·1 média·Important
≈ 32s
📋 Le fait
L'entraînement sur données de santé a renforcé la détection de la tromperie ; le modèle progresse sur 44 benchmarks sur 53 testés.
Cette approche diffère de la méthode basée sur constitution d'Anthropic, offrant une alternative pour renforcer la robustesse des modèles face aux manipulations.
L'Europe face au retard stratégique dans la course à l'intelligence artificielle
🟡 23h·✓ 4 sources
En évolutionMajeur
Des experts avertissent que l'Europe perd du terrain face aux géants américains et chinois de l'intelligence artificielle, menaçant sa souveraineté technologique.
📍 Europe
Lire la suiteReplier▾
Des experts avertissent que l'Europe perd du terrain face aux géants américains et chinois de l'intelligence artificielle, menaçant sa souveraineté technologique.
La plateforme EU Score cartographie désormais l'écosystème tech européen pour identifier les lacunes et les champions régionaux.
Cette prise de conscience pousse les institutions européennes à accélérer les investissements et les régulations pour rattraper son retard.
📍 Europe#intelligence artificielle#Europe#souveraineté technologique🏢 EU Score
Google DeepMind traite ses agents IA comme des menaces internes potentielles
🟡 19h· 1 source
En évolutionImportant
Google DeepMind développe une « AI Control Roadmap » qui applique des mesures de sécurité proportionnées aux capacités des agents IA, traitant ces derniers comme des risques internes
Lire la suiteReplier▾
Google DeepMind développe une « AI Control Roadmap » qui applique des mesures de sécurité proportionnées aux capacités des agents IA, traitant ces derniers comme des risques internes
Une analyse d'un million de tâches de codage montre que la majorité des problèmes proviennent d'agents surzélés plutôt que d'intentions malveillantes
#AI agents#insider threats#AI safety🏢 Google DeepMind
L'IA égale les médecins dans le diagnostic, mais révèle un problème de durabilité
🟡 23h· 1 source
En évolutionImportant
Deux études Nature montrent que des systèmes IA spécialisés diagnostiquent les maladies aussi bien que les médecins, parfois mieux, dans des cas patients simulés.
Lire la suiteReplier▾
Deux études Nature montrent que des systèmes IA spécialisés diagnostiquent les maladies aussi bien que les médecins, parfois mieux, dans des cas patients simulés.
Ces systèmes reposent sur des modèles de base déjà obsolètes, soulevant des questions sur la viabilité long terme de ces solutions.
#IA médicale#diagnostic assisté#modèles de base🏢 Nature