PUBLICIDADE

TOPO SITE

Google lança nova geração de chips de IA focada em desempenho e escalabilidade

Durante o Google Cloud Next, a empresa apresentou as TPUs de 8ª geração, com duas arquiteturas distintas, prometendo 80% mais desempenho por dólar em relação à geração anterior.

O Google Cloud Next, evento anual dedicado à nuvem e inteligência artificial, foi o cenário escolhido para a revelação dos novos chips de IA da empresa, que pertencem à 8ª geração das TPUs. Amin Vahdat, SVP e Chief Technologist de IA e infraestrutura do Google, anunciou as inovações em um encontro exclusivo com jornalistas e parceiros, onde abordou os desafios que envolvem a escalabilidade de sistemas de inteligência artificial cada vez mais complexos.

A nova abordagem do Google inclui duas arquiteturas de chip distintas, cada uma com um propósito específico. A TPU 8t é projetada para o treinamento de modelos, uma fase que requer um alto volume de processamento, essencial para o desenvolvimento de sistemas avançados. Por outro lado, a TPU 8i é focada na execução desses modelos, priorizando respostas rápidas e operação contínua, fundamentais para aplicações em tempo real, especialmente em um cenário onde a IA opera de maneira constante através de agentes.

De acordo com informações da empresa, a combinação das duas novas arquiteturas promete um aumento de até 80% no desempenho por dólar em comparação com a geração anterior. Vahdat, no entanto, enfatizou que a evolução da inteligência artificial não depende apenas de chips mais rápidos, mas também da capacidade de operar esses sistemas em larga escala. Atualmente, é comum que esses sistemas utilizem dezenas de milhares de chips trabalhando em conjunto, o que transforma os desafios enfrentados.

Essa mudança requer uma infraestrutura robusta, capaz de processar grandes volumes de dados e realizar melhorias em comunicação e memória entre os chips. O ritmo acelerado de evolução nessa área tem permitido o surgimento de aplicações que antes eram consideradas inviáveis, destacando a importância da infraestrutura como um elemento central na corrida pela inteligência artificial.

Os novos chips estão diretamente alinhados com a estratégia do Google para desenvolver sistemas de inteligência artificial mais autônomos, que podem executar tarefas e operar continuamente. Com isso, a demanda por processamento não só aumenta para o treinamento de modelos, mas também para manter múltiplos sistemas funcionando simultaneamente. Essa base é essencial para a transição da IA de experimentos isolados para uma aplicação em larga escala.

Embora a infraestrutura não seja visível para o público em geral, ela é fundamental para garantir que sistemas de inteligência artificial sejam operados de forma eficiente, estável e a um custo acessível. Aqueles que conseguirem implementar esses sistemas com maior eficácia terão uma vantagem competitiva significativa, permitindo a expansão da tecnologia em diversos produtos e serviços.

Leia mais

PUBLICIDADE

LATERAL
Rolar para cima