Leaderboard de LLM para Português: cientistas criam primeiro ranking de IA centrado em plataformas em PT-EU

Um grupo de investigadores da Faculdade de Ciências da Universidade de Lisboa criou e colocou em funcionamento o «primeiro comparador de desempenho de modelos de IA generativa especificamente dedicado ao português europeu» (PT-EU).

A ‘Leaderboard de LLM para Português‘, permite «avaliar e comparar diferentes modelos de forma transparente» para criar um ranking «acessível a empresas, investigadores e ao público». Desta forma, pode ser uma base importante para ao «facilitar a escolha de soluções de inteligência artificial mais adequadas ao contexto nacional».

- Publicidade -

Até agora, as principais plataformas deste tipo «estavam centradas no inglês ou noutras línguas com maior tradição tecnológica», lembra António Branco, director-geral da infraestrutura. Para que os modelos de IA sejam avaliados é preciso que os seus criadores, ou qualquer pessoa, os adicionem a esta plataforma.

Cada sistema é, depois, avaliado de «forma independente», através de testes automáticos com dados concebidos para «medir vários critérios, como qualidade da linguagem, adequação cultural e civilidade». Os resultados são publicados online, o que permite a «comparação directa entre diferentes modelos», desde que sejam open source.

- Publicidade -

Este projecto surge no âmbito da Portulan Clarin (o ‘nó’ nacional da rede europeia Clarin Eric), uma infraestrutura nacional coordenada pela Ciências ULisboa e integrada no roteiro estratégico da Fundação para a Ciência e a Tecnologia.

Segundo António Branco, este leaderboard «colmata uma lacuna importante e permite avaliar, de forma rigorosa e comparável, o desempenho de modelos de IA para português europeu, algo que até agora não existia».