Oito dos 10 supercomputadores mais rápidos do mundo do TOP500 têm maior aceleração e economizam energia com NVIDIA Enterprise

Redação NVIDIA, PC, supercomputadores, TOP500 supercomputadores

O novo ranking dos TOP500 supercomputadores mostra a grande tendência da computação científica moderna, expandida com IA e Data Analytics e acelerada com as tecnologias NVIDIA Enterprise. Oito dos 10 melhores supercomputadores do mundo agora usam GPUs NVIDIA, rede InfiniBand, ou ambos. Eles incluem os sistemas mais poderosos de EUA, Europa e China.

A NVIDIA agora, após a aquisição da Mellanox, equipa dois terços (333) dos sistemas TOP500 na lista mais recente de junho de 2020. Na lista de junho de 2017 as duas empresas separadas tinham menos da metade (203). As redes NVIDIA Mellanox InfiniBand e Ethernet conectam 305 sistemas (61%) dos supercomputadores TOP500, incluindo todos os 141 sistemas InfiniBand, e 164 (63%) dos sistemas que utilizam Ethernet.

Em eficiência energética, os sistemas que usam GPUs NVIDIA têm se destacado em relação aos demais. Os sistemas com GPUs NVIDIA, em média, são 2,8 vezes mais eficientes em termos de energia medidos em gigaflops/watt do que os sistemas que não o possuem. Essa é uma das razões pelas quais as GPUs NVIDIA agora são usadas por 20 dos 25 principais supercomputadores da lista TOP500.

O melhor exemplo dessa eficiência de energia é o Selene, a mais recente adição ao cluster de pesquisa interno da NVIDIA. O sistema era o número 2 na lista mais recente do Green500 e o número 7 no TOP500 geral, com 27,5 petaflops no benchmark Linpack. Com 20,5 gigaflops/watt, Selene está a uma fração de um ponto do primeiro lugar na lista Green500, reivindicada por um sistema muito menor que ficou em 394 em termos de desempenho.

O Selene é o único sistema dos 100 melhores a quebrar a barreira dos 20 gigaflops/watt. É também o segundo supercomputador industrial mais poderoso do mundo, atrás do sistema número 6 da gigante de energia Eni S.p.A. da Itália, que também usa GPUs NVIDIA.

No uso de energia, o Selene é 6,8 vezes mais eficiente que a média dos sistemas que não usam GPUs NVIDIA da lista TOP500. O desempenho e a eficiência energética do Selene são graças aos Tensor Cores de terceira geração nas GPUs NVIDIA A100 que aceleram a matemática tradicional de 64 bits para simulações e o trabalho de menor precisão para IA.

A classificação do Selene é uma façanha impressionante para um sistema que levou menos de quatro semanas para ser construído. Os engenheiros puderam montar o Selene rapidamente porque usaram a arquitetura de referência modular da NVIDIA. O guia define o que a NVIDIA chama de DGX SuperPOD. Baseia-se em uma construção poderosa e flexível para data centers modernos: o sistema NVIDIA DGX A100.

“A tendência atual é pesquisadores e empresas buscarem uma maior aceleração para inteligência artificial e analytics. Com GPUs e sistemas que ajudam a acelerar o processamento e economizar energia, a NVIDIA Enterprise auxilia no desenvolvimento da ciência”, explica Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina. “É por isso também que a última lista TOP500 pode refletir os esforços da NVIDIA Enterprise para democratizar a IA e o HPC.”

Brasil

Com a atualização do ranking TOP500, os supercomputadores Atlas e Fênix, ambos pertencentes a Petrobrás e montados pela Atos, líder mundial em transformação digital, são os dois maiores da América Latina.

Em operação desde abril deste ano, Atlas possui 136 servidores acelerados por GPUs NVIDIA V100, além da rede interna InfiniBand, gerando um desempenho medido de 4,4 petaflops. Em outras palavras, a capacidade de processamento do supercomputador Atlas equivale a cerca de 1,5 milhão de smartphones ou de 40 mil laptops de última geração. Ocupando a 57º posição no TOP500, Atlas é o supercomputador mais bem colocado de toda a América Latina no ranking mundial de computadores de alto desempenho.

Já o supercomputador Fênix, também da Petrobrás, passou por uma atualização este ano e hoje figura como o segundo mais poderoso da América Latina, no lugar 83 da lista. São 360 servidores acelerados por GPUs NVIDIA V100 e com rede interna InfiniBand EDR 100gbps, que atingem um desempenho medido de 3.161 TFLOPS.

Até a última edição de 2019, o Santos Dumont, também implementado pela Atos, era reconhecido como o maior supercomputador da América Latina. O supercomputador continua na lista graças a atualização de quatro petaflops, passando para a capacidade de processamento total de aproximadamente 5,1 quatrilhões de operações por segundo com 376 GPUs Tesla V100.

TOP500 supercomputadores

Vale mencionar ainda outro integrante da lista do TOP500, o supercomputador Ogbon, que fica alocado no Centro de Supercomputação do Senai Cimatec, em Salvador. O equipamento montado pela Atos e financiado pela Petrobras é utilizado na pesquisa aplicada de geologia, geofísica, engenharia de reservatórios e outros setores que abrangem a questão de óleo e gás. O Ogbon é composto por 78 nós de computação GPU (total de 312 placas aceleradoras GPU NVIDIA V100 NVLink, totalizando 2.4 petaflops de pico e 1.6 petaflops sustentáveis) e 27 nós de processamento CPU com processadores Intel Cascade Lake.

Escalonando sistemas para o SuperPODs

Com o design de referência, qualquer organização pode configurar rapidamente um cluster de computação de classe mundial. Cerca de 20 sistemas DGX A100 podem ser vinculados de maneira semelhante a Lego usando switches NVIDIA Mellanox InfiniBand de alto desempenho em menos de uma hora, criando um sistema de 2 petaflops poderoso o suficiente para aparecer na lista TOP500. Esses sistemas foram projetados para funcionar confortavelmente dentro dos recursos de energia e térmicos padrão nos datacenters.

Ao adicionar uma camada adicional de switches NVIDIA Mellanox InfiniBand, os engenheiros vincularam 14 dessas 20 unidades de sistema para criar o Selene, que possui:

280 sistemas DGX A100
240 NVIDIA GPUs A100
494 switches NVIDIA Mellanox Quantum 200G InfiniBand
56 TB/s network fabric
7PB of high-performance storage all-flash

Uma das especificações mais importantes do Selene é que ele pode oferecer mais de 1 exaflops de desempenho de IA. Outra é o Selene estabelecer um novo recorde usando apenas 16 dos seus sistemas DGX A100, uma referência de análise de dados chave – chamada TPCx-BB – oferecendo desempenho 20 vezes maior do que qualquer outro sistema.

Esses resultados são críticos no momento em que a IA e as análises estão se tornando parte dos novos requisitos para a computação científica. Em todo o mundo, os pesquisadores estão usando deep learning e análise de dados para prever as áreas mais frutíferas para a realização de experimentos. A abordagem reduz o número de experimentos caros e demorados que os pesquisadores precisam, acelerando os resultados científicos.

Por exemplo, seis sistemas ainda não incluídos na lista TOP500 estão sendo construídos hoje com as GPUs A100 da NVIDIA lançadas em maio passado. Eles vão acelerar uma mistura de HPC e IA que está definindo uma nova era na ciência.

TOP500 expande para computação científica

Um desses novos sistemas está no Laboratório Nacional de Argonne, onde os pesquisadores usarão um cluster de 24 sistemas NVIDIA DGX A100 para digitalizar bilhões de medicamentos na busca por tratamentos para a Covid-19. Já pesquisadores em Munique estão treinando modelos de linguagem natural em 6 mil GPUs no supercomputador Summit para acelerar a análise de proteínas do novo coronavírus. É outro sinal de que os principais sistemas TOP500 estão indo além das simulações tradicionais executadas com matemática de dupla precisão.

À medida que os cientistas expandem para o deep learning e analytics, eles também acessam os serviços de computação em nuvem e até mesmo transmitindo dados de instrumentos remotos na edge da rede. Juntos, esses elementos formam quatro pilares da computação científica moderna aceleradas pela NVIDIA:

Simulação: na luta contra a Covid-19, os pesquisadores do Oak Ridge National Laboratory têm simulado mais de 2 bilhões de compostos em 24 horas, executando o AutoDock em GPUs no supercomputador Summit.
IA e data analytics: a aceleração da GPU para Spark 3.0 agora oferece acelerações para o front-end crítico e demorado do pipeline de machine learning.
Streaming científico na edge: o CERN anunciou recentemente que as GPUs NVIDIA permitirão uma redução de 500 vezes na enorme quantidade de dados produzidos por eventos de colisão de partículas dentro do Large Hadron Collider.
Visualização: o software IndeX e Magnum IO da NVIDIA ajuda a fornecer uma visualização do Mars Lander, a maior visualização volumétrica interativa e em tempo real do mundo.

NVIDIA

Com a invenção da GPU pela NVIDIA (NASDAQ: NVDA), em 1999, redefinimos os gráficos de computadores modernos e revolucionamos a computação paralela. Mais recentemente, o deep learning com base em GPU deu início à inteligência artificial moderna — a próxima era da computação — com a GPU atuando como o cérebro dos computadores, robôs e carros autônomos que podem perceber e compreender o mundo. Saiba mais em http://nvidianews.nvidia.com/

Acesse também:

Site oficial da NVIDIA no Brasil: https://www.nvidia.com/pt-br/

Facebook: @NVIDIABrasil

Twitter: @NVIDIABrasil