A discussão sobre hardware para inteligência artificial tem estado focada nas placas gráficas, deixando os processadores centrais (CPU) para segundo plano. Para tentar equilibrar a balança, a Intel e a AMD juntaram esforços e criaram uma nova especificação focada nos CPU. De acordo com o site TechSpot, esta iniciativa mostra que ambas as empresas ainda vêem espaço para os processadores desempenharem um papel maior em certas cargas de trabalho de machine learning.
O que muda com as extensões ACE
A nova especificação, designada por Advanced Compute Extensions (ACE), define uma forma de lidar com operações de IA de maneira mais eficiente nos processadores x86. O objectivo não passa por substituir as placas gráficas em ambientes de treino de grande escala. Em vez disso, o foco está em modelos mais pequenos, tarefas sensíveis à latência e sistemas onde uma GPU não está disponível ou não justifica o consumo de recursos.
A transferência constante de dados entre o CPU e a GPU cria estrangulamentos no sistema. Ao manter o trabalho no processador, esse problema desaparece por completo, garantindo respostas mais rápidas.
Eficiência e compatibilidade no centro da arquitectura
A nível técnico, a norma ACE baseia-se na multiplicação de matrizes, o núcleo da maioria das operações de IA. A indústria tem dependido das instruções AVX para colmatar esta necessidade, mas a nova abordagem mantém a estrutura de registos AVX10 existente e adiciona hardware dedicado para operações de matrizes. Esta decisão evita forçar os programadores a adoptar formatos de dados ou modelos de programação totalmente novos.
- Ganhos de desempenho ao nível das instruções: Para um determinado conjunto de vectores de entrada, a norma ACE consegue executar até dezasseis vezes mais operações do que a AVX10. Embora isto não signifique que as aplicações vão correr dezasseis vezes mais depressa, aponta para uma utilização muito mais eficiente das instruções, o que se traduz num menor consumo de energia e em menos pressão sobre a largura de banda da memória.
- Consumo energético reduzido: As placas gráficas são poderosas, mas exigem muita energia e requerem movimento de dados que adiciona sobrecarga ao sistema. Em comparação, um CPU a processar estas operações directamente consegue ser mais económico, especialmente em edge computing ou aplicações para um único utilizador.
- Consistência para os programadores: A especificação foi desenhada para ser independente da implementação. Isto facilita a vida aos profissionais que trabalham com frameworks como PyTorch e TensorFlow, permitindo-lhes focar num alvo único e consistente, em vez de gerir diferentes caminhos de código para vários níveis de suporte AVX.
O futuro do processamento local
O mercado dos computadores portáteis está a passar por uma transformação profunda. Enquanto a concorrência se mexe, com a preparação da próxima geração de chips ARM para o mercado móvel, a arquitectura x86 precisa de provar a sua relevância. A norma ACE suporta uma vasta gama de tipos de dados usados em machine learning, incluindo INT8, FP16 e suporte nativo para formatos do Open Compute Project MX. Esta flexibilidade é crucial numa altura em que as exigências dos modelos variam imenso.
A integração de capacidades de IA directamente no CPU oferece uma alternativa viável aos NPU (Unidades de Processamento Neural), que, embora comuns, ainda carecem de estandardização. Mesmo sabendo que o futuro trará soluções híbridas que juntam processadores tradicionais a gráficos de alto desempenho no mesmo chip, ou até novos portáteis que usam o novo chip Nvidia dedicado à IA, a norma ACE garante que o CPU tradicional não fica obsoleto.
As placas gráficas vão continuar a dominar o treino de IA em grande escala, mas com estas alterações arquitectónicas, os processadores x86 estão prontos para lidar com uma fatia muito mais ampla do trabalho diário.