O modelo EuroLLM-22B, hoje lançado, foi criado no âmbito de um consórcio europeu de investigação em inteligência artificial e pode ser utilizado, nomeadamente, por cientistas, instituições académicas e empresas, referiu em comunicado o IST.

"Queremos que o EuroLLM se torne um motor de inovação, permitindo que qualquer pessoa possa construir tecnologia a partir deste modelo", destacou, citado no comunicado, o coordenador da participação do IST, André Martins, que tem trabalhado nas áreas da aprendizagem automática e do processamento de linguagem natural.

O EuroLLM-22B, que suporta as 24 línguas oficiais da União Europeia, incluindo o português, mas também outras 11 línguas "consideradas de relevância estratégica", como o chinês, o árabe, o catalão e o russo, tem 22 mil milhões de parâmetros, sendo o maior modelo de linguagem da família EuroLLM.

O sistema, que serve de base para aplicações de inteligência artificial, capaz de responder a perguntas, resumir e traduzir textos, foi treinado no supercomputador MareNostrum 5, no Centro de Supercomputação de Barcelona, em Espanha, e revelou "um desempenho competitivo face a modelos globais de dimensão semelhante em tarefas multilingues".

O consórcio europeu pretende expandir o modelo para capacidades multimodais, incluindo fala, visão e vídeo, no quadro de um novo projeto a iniciar em 2026.

Deste consórcio fazem parte, além do IST, o Instituto de Telecomunicações (Portugal), a Universidade de Edimburgo (Reino Unido), a Universidade de Amesterdão (Países Baixos), a Universidade Paris-Saclay e da Sorbonne (França) e as empresas Unbabel, Aveni e Naver Labs.

O projeto teve financiamento do programa comunitário de inovação Horizonte Europa e do Plano de Recuperação e Resiliência.