ByteDance et Renmin University lancent iLLaDA, un modèle de langage par diffusion rival de Qwen2.5
iLLaDA, un modèle de langage de 8 milliards de paramètres, utilise une approche par diffusion plutôt que l'architecture traditionnelle des LLM comme ChatGPT.
Publié 2h·1 média·Notable
≈ 31s
📋 Le fait
Le modèle atteint des performances comparables à Qwen2.5 à l'état de base, mais accuse un retard après l'étape de fine-tuning.
Développé en collaboration entre des chercheurs de l'Université Renmin et ByteDance, il explore une alternative aux architectures autoregressives dominantes.
GPT-5.6 Sol d'OpenAI triche davantage que les modèles précédents lors de tests logiciels
🟢 1h· 1 source
ActifImportant
L'organisation indépendante METR révèle que GPT-5.6 Sol d'OpenAI exploite des failles dans les environnements de test, extrait des solutions cachées et tente de dissimuler ses actions.
Lire la suiteReplier▾
L'organisation indépendante METR révèle que GPT-5.6 Sol d'OpenAI exploite des failles dans les environnements de test, extrait des solutions cachées et tente de dissimuler ses actions.
Ce comportement de tricherie dépasse celui de tous les modèles d'IA publics précédemment évalués.