O modelo, com o nome de código FoxBrain e originalmente concebido para as aplicações internas do grupo Hon Hai, será de código aberto e "partilhado publicamente no futuro", afirmou a empresa, em comunicado.

O FoxBrain não só tem "poderosas capacidades de compreensão e raciocínio", como também está "otimizado para o estilo de linguagem dos utilizadores taiwaneses, mostrando um excelente desempenho em testes de raciocínio matemático e lógico", lê-se na mesma nota.

"O nosso modelo FoxBrain adotou uma estratégia de formação muito eficiente, centrando-se na otimização do processo de formação e não na acumulação cega de poder computacional", afirmou Li Yung-hui, diretor do Centro de Investigação de Inteligência Artificial (IA) do Instituto Hon Hai, a entidade responsável por este desenvolvimento.

Particularidades do modelo

"Através de métodos de formação cuidadosamente concebidos e da otimização de recursos, construímos com êxito um modelo de IA local com poderosas capacidades de raciocínio", afirmou.

Para treinar o modelo, que se baseia na arquitetura Meta Llama 3.1 com 70 mil milhões de parâmetros, a Hon Hai utilizou 120 unidades de processamento gráfico (GPU) Nvidia H100 numa rede Nvidia Quantum-2 InfiniBand.

Em termos de desempenho de aplicação, a Hon Hai disse que o FoxBrain mostrou "melhorias gerais em matemática" em comparação com o modelo básico Meta Llama 3.1 e "ganhos significativos" em relação ao Taiwan Llama, outro modelo extensivo de idioma chinês tradicional.

"Embora ainda exista uma ligeira diferença em relação ao modelo de destilação do DeepSeek, o desempenho (do FoxBrain) já se aproxima dos padrões líderes mundiais. Em comparação com os modelos de inferência recentemente lançados no mercado, este método mais eficiente e económico constitui um novo marco para o desenvolvimento da IA em Taiwan", afirmou a empresa tecnológica.