GLM-5.2 de Zhipu AI rivalise avec Claude Opus 4.5 à coût réduit, selon Snowflake
🟢 1h· 1 source
ActifImportant
Le modèle GLM-5.2 de Zhipu AI atteint des performances proches de Claude Opus 4.7 (Anthropic) sur 103 tâches de codage, selon un benchmark de Snowflake, pour un coût par token cinq fois inférieur.
Lire la suiteReplier▾
Le modèle GLM-5.2 de Zhipu AI atteint des performances proches de Claude Opus 4.7 (Anthropic) sur 103 tâches de codage, selon un benchmark de Snowflake, pour un coût par token cinq fois inférieur.
Malgré une consommation de tokens deux fois supérieure par tâche, son avantage tarifaire pourrait perturber les acteurs occidentaux comme Anthropic et OpenAI.
OpenAI et Broadcom dévoilent Jalapeño, une puce dédiée à l'inférence des LLM
🟢 4h· 1 source
ActifImportant
OpenAI intègre du matériel sur mesure avec la puce Jalapeño, co-développée avec Broadcom, optimisée pour l'inférence des grands modèles de langage (LLM).
Lire la suiteReplier▾
OpenAI intègre du matériel sur mesure avec la puce Jalapeño, co-développée avec Broadcom, optimisée pour l'inférence des grands modèles de langage (LLM).
Ce composant devrait être déployé à grande échelle d'ici fin 2026, visant à améliorer les performances et l'efficacité des traitements d'IA.