OpenAI e Broadcom anunciam chip Jalapeño para inferência de LLMs em escala em data centers

A OpenAI e a Broadcom anunciaram o desenvolvimento conjunto do Jalapeño, um chip ASIC dedicado e otimizado para inferência de grandes modelos de linguagem, com implantação planejada em data centers ainda neste ano. O componente foi customizado a partir da rota tecnológica da OpenAI, com o objetivo de melhorar a eficiência energética e reduzir a dependência de fornecedores externos de GPUs. As empresas dizem que a iniciativa busca diminuir a dependência de companhias como a Nvidia e avançar na integração vertical. Ainda não há dados de desempenho medidos em produção, e um relatório técnico detalhado deve ser apresentado nos próximos meses.