OpenAI et Broadcom dévoilent Jalapeño, une puce ASIC dédiée à l’inférence des LLM, déploiement prévu d’ici fin d’année
OpenAI et Broadcom annoncent avoir co-développé Jalapeño, une puce ASIC spécialisée pour l’inférence de grands modèles de langage, avec un déploiement prévu dans des centres de données d’ici la fin de l’année. Le composant, conçu sur la base de la feuille de route technique d’OpenAI, vise à améliorer l’efficacité énergétique et à réduire la dépendance à des fournisseurs de GPU tiers. Les deux groupes disent vouloir limiter leur recours à des acteurs externes comme Nvidia en avançant vers une intégration verticale. Aucun chiffre de performances mesurées n’a été publié à ce stade, un rapport technique détaillé étant attendu dans les prochains mois.