A Amazon (NASDAQ:AMZN) Web Services (AWS) anunciou a introdução de novos servidores de data center equipados com seus chips de inteligência artificial (IA) proprietários, apresentando um desafio à dominância da Nvidia (NASDAQ:NVDA) no setor. A Apple Inc (NASDAQ:AAPL). foi confirmada como cliente, planejando utilizar estes novos chips Trainium2. A unidade de nuvem da AWS revelou que estes servidores farão parte de um supercomputador massivo, que incorporará centenas de milhares de chips. Este anúncio foi feito na terça-feira.
Este supercomputador, alimentado pelos chips Trainium2 da AWS, será utilizado pela startup de IA Anthropic como a primeira empresa a usar esta tecnologia. A Anthropic é conhecida por criar sistemas de IA confiáveis e interpretáveis e aproveitará o poder computacional para aprimorar as capacidades de seus modelos de IA.
Benoit Dupin, um executivo da Apple, também reconheceu que o gigante da tecnologia está empregando chips Trainium2, sinalizando uma adoção significativa da nova oferta da AWS.
Matt Garman, CEO da AWS, revelou ainda que a empresa já está trabalhando no Trainium3, a próxima evolução de seu chip de IA, que está programado para estrear no próximo ano.
As novas instâncias Amazon Elastic Compute Cloud (Amazon EC2), alimentadas pelo AWS Trainium2, estão agora geralmente disponíveis e introduzem os Trn2 UltraServers. Estes UltraServers são projetados para fornecer desempenho e eficiência de custo excepcionais para treinar e implantar modelos de IA contemporâneos, incluindo grandes modelos de linguagem (LLM) e modelos de fundação (FM).
As instâncias Trn2 prometem uma melhoria de 30-40% no desempenho de preço em comparação com as atuais instâncias EC2 baseadas em GPU e contam com 16 chips Trainium2, oferecendo 20,8 petaflops de pico de computação. Isso os torna ideais para lidar com cargas de trabalho de IA com bilhões de parâmetros.
Para tarefas de IA ainda mais exigentes, os Trn2 UltraServers oferecem um novo serviço EC2, apresentando 64 chips Trainium2 interconectados para até 83,2 petaflops de pico de computação. Esta configuração quadruplica as capacidades de computação, memória e rede de uma única instância, permitindo o treinamento e a implantação dos maiores modelos de IA do mundo.
O projeto colaborativo entre AWS e Anthropic, denominado Project Rainier, visa construir um EC2 UltraCluster de Trn2 UltraServers, que se tornará o maior cluster de computação de IA do mundo uma vez concluído.
A AWS também destacou o próximo chip Trainium3, que será fabricado usando um nó de processo de 3 nanômetros, prometendo quadruplicar o desempenho dos atuais Trn2 UltraServers.
O kit de desenvolvimento de software (SDK) AWS Neuron facilita a otimização de modelos de IA para rodar em chips Trainium, suportando frameworks populares como JAX e PyTorch, e está integrado com o hub de modelos Hugging Face, que hospeda mais de 100.000 modelos.
As instâncias Trn2 estão atualmente disponíveis na Região AWS US East (Ohio), com planos de expandir a disponibilidade para regiões adicionais em breve. Enquanto isso, os Trn2 UltraServers estão sendo oferecidos em fase de preview.