A Microsoft anunciou, no dia 26 de setembro de 2023, o lançamento do chip Maia 200, um novo acelerador de Inteligência Artificial que visa reduzir custos e ampliar a utilização de IA em grande escala. O chip já está em operação em um dos data centers da empresa nos Estados Unidos e o próximo a receber a novidade será o US West 3, localizado perto de Phoenix, Arizona.
Desempenho e tecnologia do Maia 200
Fabricado no avançado processo de 3nm da TSMC, o Maia 200 foi projetado para ser o “cérebro” de aplicações de IA complexas. Ele possui uma capacidade impressionante de mover dados a 7 TB/s, o que minimiza qualquer tipo de engasgo no sistema. Além disso, promete ser três vezes mais rápido que o chip da terceira geração do Amazon Trainium e superar a performance do Google TPU em operações FP8.
Economia e eficiência
O Maia 200 se destaca também pela eficiência, oferecendo uma economia de 30% no custo de desempenho em comparação com gerações anteriores. Cada unidade do chip integra mais de 100 bilhões de transistores personalizados, permitindo suportar cargas de trabalho massivas e rodar os modelos de IA mais complexos da atualidade.
Inovação em data centers
O chip utiliza um subsistema de memória reprojetado para operar com tipos de dados de precisão reduzida, o que permite armazenar localmente uma maior quantidade de informações. Essa abordagem otimiza o fluxo de dados e reduz a necessidade de múltiplos dispositivos para execução. A arquitetura do Maia 200 foi desenhada para escalar sobre Ethernet padrão, combinando uma camada de transporte personalizada com NIC integrada, resultando em menor consumo de energia e custo total de propriedade para a frota global do Azure.
Protocolos de comunicação avançados
Além disso, o Maia 200 utiliza protocolos de comunicação que minimizam saltos na transmissão de dados, simplificando a programação e melhorando a flexibilidade das cargas de trabalho. Essa malha unificada garante um desempenho consistente e eficiente em escala de nuvem.
Opinião
O lançamento do chip Maia 200 representa um avanço significativo na tecnologia de IA, prometendo não apenas melhorias de desempenho, mas também uma redução importante nos custos operacionais, o que pode impactar positivamente o setor.
