A primeira versão, disponibilizada este mês de maio, tem 900 milhões de parâmetros. Para já esta versão destina-se a investigadores e organizações, públicas e privadas, grandes e pequenas, de todos os sectores económicos.











No momento da publicação, o desempenho desta funcionalidade estabelece o estado da arte para o Português relativamente a modelos neuronais de linguagem publicados e abertos.





É este tipo de modelos de linguagem que suportam toda a gama de aplicações de IA que está a fazer furor, desde chatbots até tradução automática.





"Trata-se de um marco histórico muito importante na preparação tecnológica da Língua Portuguesa para a era digital", diz António Branco, professor do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa (DI Ciências ULisboa).

António Branco é também um dos coordenadores do NLX - Grupo da Fala e Linguagem Natural da Ciências ULisboa e coordenador da equipa deste projeto, desenvolvido em parceria com a Faculdade de Engenharia da Universidade do Porto (FEUP), composto por João Rodrigues, Luís Gomes, João Silva e Rodrigo Santos, em conjunto com os investigadores Henrique Lopes Cardoso e Tomás Osório do Laboratório de Inteligência Artificial e Ciência de Computadores da FEUP.









O Albertina PT é um codificador da família BERT, baseado na arquitetura neural Transformer e desenvolvido sobre o modelo DeBERTa.