Uma conferência de tecnologia avançada para arquitetos de processadores e sistemas da indústria e da academia se tornou um fórum fundamental para o mercado de computação de data centers, avaliado em trilhões de dólares. No Hot Chips 2024, que acontecerá na próxima semana, engenheiros sêniores da NVIDIA apresentarão os avanços mais recentes que impulsionam a plataforma NVIDIA Blackwell, além de pesquisas sobre resfriamento a líquido para data centers e agentes de IA para design de chips.
Eles compartilharão como:
- A NVIDIA Blackwell reúne múltiplos chips, sistemas e o software NVIDIA CUDA para impulsionar a próxima geração de IA em diversos casos de uso, indústrias e países.
- O NVIDIA GB200 NVL72 — uma solução de rack multi-node, resfriada a líquido, que conecta 72 GPUs Blackwell e 36 CPUs Grace — eleva o padrão de design de sistemas de IA.
- A tecnologia de interconexão NVLink oferece comunicação GPU para GPU, permitindo uma inferência de IA generativa com alto rendimento e baixa latência.
- O Sistema de Quantização Quasar da NVIDIA ultrapassa os limites da física para acelerar a computação de IA.
- Pesquisadores da NVIDIA estão desenvolvendo modelos de IA que auxiliam na construção de processadores para IA.
Uma palestra sobre a NVIDIA Blackwell, que ocorrerá na segunda-feira, 26 de agosto, também destacará novos detalhes arquitetônicos e exemplos de modelos de IA generativa rodando em silício Blackwell.
Precedendo essa palestra, três tutoriais no domingo, 25 de agosto, abordarão como soluções híbridas de resfriamento a líquido podem ajudar data centers a transitar para uma infraestrutura mais eficiente em termos energéticos e como modelos de IA incluindo agentes movidos por grandes modelos de linguagem (LLM), podem ajudar engenheiros a projetar a próxima geração de processadores.
Essas apresentações, em conjunto, mostram como os engenheiros da NVIDIA estão inovando em todas as áreas da computação e design de data centers para oferecer desempenho, eficiência e otimização sem precedentes.
Prepare-se para a Blackwell
A NVIDIA Blackwell é o desafio definitivo de computação full-stack. Ele compreende múltiplos chips da NVIDIA, incluindo a GPU Blackwell, a CPU Grace, a unidade de processamento de dados BlueField, a placa de interface de rede ConnectX, o switch NVLink, o switch Ethernet Spectrum e o switch InfiniBand Quantum.
Ajay Tirumala e Raymond Wong, diretores de arquitetura da NVIDIA, apresentarão uma primeira visão da plataforma e explicarão como essas tecnologias trabalham juntas para oferecer um novo padrão de desempenho em IA e computação acelerada, ao mesmo tempo que avançam na eficiência energética.
A solução multinode NVIDIA GB200 NVL72 é um exemplo perfeito. A inferência de LLMs requer geração de tokens com baixa latência e alto rendimento. O GB200 NVL72 atua como um sistema unificado para fornecer até 30x mais rapidez na inferência para cargas de trabalho LLM, desbloqueando a capacidade de executar modelos com trilhões de parâmetros em tempo real.
Tirumala e Wong também discutirão como o Sistema de Quantização Quasar da NVIDIA — que reúne inovações algorítmicas, bibliotecas e ferramentas de software da NVIDIA, e o segundo motor Transformer de geração do Blackwell — suporta alta precisão em modelos de baixa precisão, destacando exemplos com LLMs e IA generativa visual.
“A plataforma NVIDIA Blackwell representa um marco significativo na evolução da computação acelerada, unindo o que há de mais avançado em hardware e software para impulsionar a próxima geração de inteligência artificial. Combinando múltiplos chips, como as GPUs Blackwell e as CPUs Grace, estamos estabelecendo novos padrões de desempenho e eficiência energética, permitindo que empresas em todo o mundo desbloqueiem o verdadeiro potencial da IA em escala”, reforça Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.