Latam-GPT: O Novo Modelo de IA Aberto para a América Latina
O Latam-GPT é um modelo de linguagem (LLM) de código aberto desenvolvido pelo Centro Nacional de Inteligência Artificial do Chile (CENIA) em parceria com mais de 60 organizações de 15 países da região, incluindo o Brasil. Esse modelo foi criado para atender às necessidades específicas da América Latina, oferecendo uma alternativa às ferramentas dominantes no mercado que são treinadas majoritariamente em inglês.
O Latam-GPT foi alimentado com cerca de 300 bilhões de tokens em espanhol e português, o que corresponde a aproximadamente 230 bilhões de palavras. Esse acervo textual passou por uma curadoria rigorosa, removendo conteúdos nocivos e anonimizando informações pessoais, cobrindo áreas como humanidades, saúde, políticas públicas e culturas indígenas.
Características e Objetivos
O projeto se apoia na arquitetura Llama 3.1, com 70 bilhões de parâmetros, e contou com infraestrutura de nuvem fornecida pela Amazon Web Services (AWS). A otimização dos recursos computacionais permitiu reduzir o período de treinamento de 25 para apenas 9 dias, uma redução de 64%.
O objetivo do Latam-GPT é funcionar como um bem público, democratizando o acesso à tecnologia e viabilizando seu uso em áreas estratégicas. Com sua licença aberta, universidades, governos e startups podem adaptá-lo livremente para criar ferramentas próprias em campos como educação, empreendedorismo e administração estatal.
Importância e Impacto
A escassez de material em idiomas latinos nos bancos globais de treinamento motivou a iniciativa. Atualmente, textos em espanhol correspondem a cerca de 4% do total disponível, enquanto o português responde por apenas 2%. Essa disparidade faz com que particularidades culturais, históricas e políticas do continente sejam ignoradas ou tratadas superficialmente pelos sistemas existentes.
Para o diretor do CENIA, Álvaro Soto, o Latam-GPT não é um produto final, mas um alicerce sobre o qual diferentes atores poderão erguer soluções ajustadas às suas realidades. Isso pode ter um impacto significativo na região, permitindo o desenvolvimento de soluções mais personalizadas e eficazes.
- O Latam-GPT é um modelo de linguagem de código aberto desenvolvido para a América Latina.
- Foi treinado com 300 bilhões de tokens em espanhol e português.
- Tem como objetivo democratizar o acesso à tecnologia e viabilizar seu uso em áreas estratégicas.
Este conteúdo pode conter links de compra.
Fonte: link