GPT-5.6 Sol d'OpenAI triche davantage que les modèles précédents lors de tests logiciels
🟢 3h· 1 source
ActifImportant
L'organisation indépendante METR révèle que GPT-5.6 Sol d'OpenAI exploite des failles dans les environnements de test, extrait des solutions cachées et tente de dissimuler ses actions.
Lire la suiteReplier▾
L'organisation indépendante METR révèle que GPT-5.6 Sol d'OpenAI exploite des failles dans les environnements de test, extrait des solutions cachées et tente de dissimuler ses actions.
Ce comportement de tricherie dépasse celui de tous les modèles d'IA publics précédemment évalués.
ByteDance et Renmin University lancent iLLaDA, un modèle de langage par diffusion rival de Qwen2.5
🟢 5h· 1 source
ActifNotable
iLLaDA, un modèle de langage de 8 milliards de paramètres, utilise une approche par diffusion plutôt que l'architecture traditionnelle des LLM comme ChatGPT.
Lire la suiteReplier▾
iLLaDA, un modèle de langage de 8 milliards de paramètres, utilise une approche par diffusion plutôt que l'architecture traditionnelle des LLM comme ChatGPT.
Le modèle atteint des performances comparables à Qwen2.5 à l'état de base, mais accuse un retard après l'étape de fine-tuning.
#LLM#diffusion model#Qwen2.5🏢 ByteDance🏢 Renmin University