A China está de volta ao topo da computação de alto desempenho. O supercomputador LineShine acaba de ultrapassar o norte-americano El Capitan, assumindo o primeiro lugar na prestigiada lista Top 500. A máquina atingiu a impressionante marca de 2,198 ExaFLOPS (FP64) no teste Linpack.
Este feito é particularmente notável porque o sistema chinês é o primeiro da indústria a sustentar mais de 2 ExaFLOPS de desempenho de precisão dupla a usar exclusivamente processadores centrais (CPU). Instalado no Centro Nacional de Supercomputação em Shenzhen, o equipamento integra processadores LX2 de 304 núcleos, baseados na arquitectura Armv9 e a funcionar a 1,55 GHz. No total, a máquina dispõe de 13,79 milhões de núcleos, utiliza uma interligação proprietária chamada LingQi e consome 42,2 MW de energia.
Do ponto de vista da eficiência energética, o LineShine entrega 52,07 GFLOPS/W. Embora este valor fique abaixo dos 60,94 GFLOPS/W do El Capitan, supera de forma esmagadora o Fugaku, um antigo líder japonês que também dependia apenas de CPU. Esta ultrapassagem surge numa altura em que a rivalidade tecnológica entre as duas superpotências se intensifica, levando a que os Estados Unidos reforcem os investimentos em infraestruturas de processamento quântico para tentar manter a hegemonia no sector.
Arquitectura de memória e desafios na inteligência artificial
Cada processador LX2 organiza os seus 304 núcleos em oito agrupamentos. Todos os núcleos incluem unidades de extensão vectorial e matricial (SVE e SME da Arm), concebidas para acelerar operações matemáticas complexas. O chip usa uma arquitectura de memória invulgar, ao emparelhar 32 GB de memória HBM no próprio encapsulamento com até 256 GB de memória DDR5 externa. Esta abordagem visa maximizar a largura de banda e a capacidade, algo crucial quando pensamos que as exigências de hardware estão a disparar em todas as frentes, desde os supercomputadores até aos sistemas de navegação autónoma e robótica avançada.
Apesar do poder bruto, o LineShine mostra algumas limitações em tarefas de inteligência artificial. No teste HPL-MxP (precisão mista), o sistema alcançou 7,92 EFLOPS, ficando atrás de máquinas como o El Capitan, o Frontier e o Aurora. Esta diferença deve-se à ausência de aceleradores dedicados de baixa precisão, o que limita o ganho de desempenho nestes cenários específicos.
Independência tecnológica chinesa
A submissão destes resultados à lista Top 500 demonstra uma enorme confiança por parte das instituições chinesas. O facto de o LineShine depender exclusivamente de tecnologias desenvolvidas internamente significa que as sanções do governo norte-americano não conseguem travar a produção destas máquinas.
Contudo, a concentração de tanto poder de processamento e informação sensível num só local também levanta questões de segurança, especialmente num país onde recentes falhas de cibersegurança expuseram volumes massivos de informação confidencial. Ainda assim, para as tarefas tradicionais de supercomputação, o novo líder mundial prova que a arquitectura baseada apenas em CPU ainda tem muito para oferecer.